Administrativ information
Titel | Förberedande dataanalys |
Varaktighet | 60 |
Modul | A |
Typ av lektion | Föreläsning |
Fokus | Tekniska – Grunderna för AI |
Ämne | Förberedande dataanalys |
Nyckelord
Dataprospektering, T-SNE, PCA,
Lärandemål
- Eleven känner till de grundläggande diagramtyperna och vet när de ska användas.
- Eleven kan använda visualiseringar för att undersöka en variabelfördelning.
- Eleven kan kontrollera beroenden mellan variabler genom att använda visualisering.
- Learner kan visualisera ett högdimensionellt dataset med hjälp av PCA och T-SNE.
Förväntad förberedelse
Lärande händelser som ska slutföras innan
Ingen.
Obligatoriskt för studenter
- Läs bloggen Använda T-SNE i Python för att visualisera högdimensionella datauppsättningar (alternativ)
- Läs kapitel 4 i Python Data Science Handbook
Valfritt för studenter
Ingen.
Referenser och bakgrund för studenter
Ingen.
Rekommenderas för lärare
- Om visualisering av dataset med hög dimension: Använda T-SNE i Python
- Kapitel 4 i Python Data Science Handbook
Lektionsmaterial
Instruktioner för lärare
Denna föreläsning fokuserar på datavisualisering som en del av processen Exloratory Data Analysis (EDA). Därför omfattar den inte datavisualisering för exempelvis berättande och presentationer.
Ämnen att täcka
- Introduktion till datavisualisering (5 min)
- Mål för datavisualiseringar (EDA, storytelling)
- Vilket diagram som ska användas för vilket problem (15 min)
- Diagramtyper och deras användning
- Hur man väljer rätt diagram
- Do’s och Dont’s
- Sök efter (o)beroende variabler (10 min)
- Visualisering av högdimensionella data (20 min)
- PCA
- T-SNE
Erkännanden
Masterprogrammet Human-Centered AI har samfinansierats av Fonden för ett sammanlänkat Europa i Europeiska unionen inom ramen för Grant CEF-TC-2020–1 Digital Skills 2020 EU-IA-0068.