Administrative oplysninger
Titel | Sonderende dataanalyse |
Varighed | 60 |
Modul | A |
Lektionstype | Forelæsning |
Fokus | Teknisk — Grundlæggelser af kunstig intelligens |
Emne | Sonderende dataanalyse |
Nøgleord
Dataudforskning, T-SNE, PCA,
Læringsmål
- Læreren kender de grundlæggende diagramtyper og ved, hvornår de skal bruges.
- Eleven kan bruge visualiseringer til at undersøge en variabel fordeling.
- Eleven kan kontrollere for afhængigheder mellem variabler ved hjælp af visualisering.
- Eleven er i stand til at visualisere et højt dimensionelt datasæt ved hjælp af PCA og T-SNE.
Forventet forberedelse
Læringsbegivenheder, der skal fuldføres før
Ingen.
Obligatorisk for studerende
- Læs bloggen Brug af T-SNE i Python til at visualisere højdimensionelle datasæt (alternativ)
- Læs kapitel 4 i Python Data Science Handbook
Valgfrit for studerende
Ingen.
Referencer og baggrund for studerende
Ingen.
Anbefalet til lærerne
- Om visualisering af datasæt med høj dimension: Brug af T-SNE i Python
- Kapitel 4 i Python Data Science Handbook
Undervisningsmaterialer
Instruktioner til lærerne
Dette foredrag fokuserer på datavisualisering som en del af Exloratory Data Analysis (EDA) proces. Derfor dækker den ikke datavisualisering til f.eks. historiefortælling og præsentationer.
Emner, der skal dækkes
- Introduktion til datavisualisering (5 min)
- Mål for datavisualiseringer (EDA, storytelling)
- Hvilket diagram skal bruges til hvilket problem (15 min)
- Diagramtyper og deres anvendelse
- Sådan vælger du det rigtige diagram
- Do's og Dont's
- Tjek for (u)afhængige variabler (10 min)
- Visualisering af data med høj dimension (20 min.)
- PCA
- T-SNE
Anerkendelser
Programmet Human-Centered AI Masters blev samfinansieret af Connecting Europe-faciliteten i Den Europæiske Union under tilskud CEF-TC-2020-1 Digital Skills 2020-EU-IA-0068.