Administratieve informatie
Titel | Gegevensvoorbereiding en -verkenning |
Looptijd | 60 |
Module | A |
Type les | Lezing |
Focus | Praktisch — AI-modellering |
Onderwerp | Methoden voor gegevensvoorbereiding |
Sleutelwoorden
Gegevensvoorbereiding, Gegevensreiniging, Gegevenstransformatie, Gegevensnormalisatie, Gegevensintegratie, Gegevensreductie,
Leerdoelen
- Om op basis van de case de meest geschikte datavoorbereidingsmethode te kunnen kiezen
- gegevens voorbereiden in de praktijk (behandel ontbrekende waarden, creëer nieuwe afgeleide functies)
- Gegevensverrijking
- Ethisch: anonimisering en problemen met deze (identificatie mogelijk op indirecte manieren) — ook hier zouden enkele voorbeelden moeten zijn.
- Toerekening — vermeld dat het bias kan introduceren en dat dit in gedachten moet worden gehouden
- Nieuwe feature creatie — verlies van de juiste semantiek
- Ethisch: verwijder bias uit de dataset
- Parallellen en verschillen tussen steekproeftrekking van gegevens in statistieken en verwerving van gegevens (inclusief big data) voor ML en AI
Verwachte voorbereiding
Leren van gebeurtenissen die moeten worden voltooid voordat
Verplicht voor studenten
- N.V.T.
Optioneel voor studenten
- N.V.T.
Referenties en achtergronden voor studenten
- N.V.T.
Aanbevolen voor docenten
Instructies voor docenten
U kunt deze klasse rond de dia’s baseren.
Omtrek
Duur (min) | Omschrijving | Concepten | |
---|---|---|---|
5 | Omtrek | Methoden voor gegevensvoorbereiding: wat heeft het voor zin? | |
5 | Problemen/Voorbewerking | Welke problemen kunnen de gegevens hebben, schoonmaken, zuiveren | |
5 | Gegevensvoorbereiding | Reiniging, transformatie, integratie, normalisatie, toerekening, geluidsidentificatie | |
5 | Gegevensvoorbereiding in detail | Vormen van gegevensvoorbereiding | |
10 | Gegevensreiniging in detail | Herstellen of verwijderen van onjuiste, beschadigde, onjuist geformatteerde, dubbele of onvolledige gegevens binnen een dataset | |
10 | Datatransformatie in detail | Het omzetten van gegevens van het ene formaat naar het andere, best practices. | |
5 | Gegevensnormalisatie in detail | Beste praktijken voor gegevensnormalisatie. | |
5 | Data-integratie in detail | Best practices voor data-integratie. | |
5 | Gegevensreductie in detail | Best practices voor gegevensreductie. | |
10 | Gegevensvoorbereiding in de praktijk | Filteren, ontbrekende waarden, duplicaten, | |
5 | Slotopmerkingen | Het benadrukken van het belang van data-voorbereiding. |
Erkenningen
Het Human-Centered AI Masters-programma werd mede gefinancierd door de Connecting Europe Facility van de Europese Unie in het kader van de subsidie CEF-TC-2020-1 Digital Skills 2020-EU-IA-0068.