Administratieve informatie
Titel | Verkennende gegevensanalyse |
Looptijd | 60 |
Module | A |
Type les | Lezing |
Focus | Technisch — Stichtingen van AI |
Onderwerp | Verkennende gegevensanalyse |
Sleutelwoorden
Gegevensexploratie, T-SNE, PCA,
Leerdoelen
- De leerling kent de basisdiagramtypen en weet wanneer ze moeten worden gebruikt.
- De leerling kan visualisaties gebruiken om een variabele verdeling te onderzoeken.
- De leerling kan controleren op afhankelijkheden tussen variabelen met behulp van visualisatie.
- Leerling is in staat om een hoge dimensionale dataset te visualiseren met behulp van PCA en T-SNE.
Verwachte voorbereiding
Leren van gebeurtenissen die moeten worden voltooid voordat
Geen.
Verplicht voor studenten
- Lees de blog Het gebruik van T-SNE in Python om high-dimensional datasets te visualiseren (alternatief)
- Lees hoofdstuk 4 van Python Data Science Handbook
Optioneel voor studenten
Geen.
Referenties en achtergronden voor studenten
Geen.
Aanbevolen voor docenten
- Over het visualiseren van hoge dimensionale datasets: T-SNE gebruiken in Python
- Hoofdstuk 4 van Python Data Science Handbook
Lesmateriaal
Instructies voor docenten
Deze lezing richt zich op datavisualisatie als onderdeel van het Exloratory Data Analysis (EDA) proces. Vandaar dat het geen betrekking heeft op datavisualisatie voor bijvoorbeeld storytelling en presentaties.
Onderwerpen om te behandelen
- Inleiding tot datavisualisatie (5 min)
- Doelen van datavisualisaties (EDA, storytelling)
- Welke grafiek te gebruiken voor welk probleem (15 min)
- Grafiektypen en hun gebruik
- Hoe de juiste grafiek te kiezen
- Do’s en Dont’s
- Controleer op (on)afhankelijke variabelen (10 min)
- Visualiseren van hoge dimensionale gegevens (20 min)
- PSO
- T-SNE
Erkenningen
Het Human-Centered AI Masters-programma werd mede gefinancierd door de Connecting Europe Facility van de Europese Unie in het kader van de subsidie CEF-TC-2020-1 Digital Skills 2020-EU-IA-0068.