Administrative oplysninger
Titel | Forberedelse og undersøgelse af data |
Varighed | 60 |
Modul | A |
Lektionstype | Forelæsning |
Fokus | Praktisk — modellering af kunstig intelligens |
Emne | Metoder til udarbejdelse af data |
Nøgleord
Dataforberedelse, Datarensning, Datatransformation,Datanormalisering, Dataintegration, Datareduktion,
Læringsmål
- At kunne vælge den mest egnede dataforberedelsesmetode baseret på sagen
- forbered data i praksis (håndter manglende værdier, skaber nye afledte funktioner)
- Databerigelse
- Etisk: anonymisering og problemer med dette (identifikation muligt på indirekte måder) — igen bør der være nogle eksempler derude
- Imputation — nævne, at det kan indføre bias, og at dette skal tages i betragtning
- Ny funktion skabelse — tab af ordentlig semantik
- Etisk: fjern bias fra datasættet
- Paralleller og forskelle mellem stikprøver af data i statistikker og indsamling af data (herunder big data) for ML og AI
Forventet forberedelse
Læringsbegivenheder, der skal fuldføres før
Obligatorisk for studerende
- IKKE RELEVANT
Valgfrit for studerende
- IKKE RELEVANT
Referencer og baggrund for studerende
- IKKE RELEVANT
Anbefalet til lærerne
Undervisningsmaterialer
Instruktioner til lærerne
Du kan basere denne klasse omkring rutsjebanerne.
Omrids
Varighed (min) | Beskrivelse | Koncepter | |
---|---|---|---|
5 | Omrids | Metoder til udarbejdelse af data: hvad er pointen? | |
5 | Problemer/forbehandling | Hvilke problemer kan dataene have, rengøring, rensning | |
5 | Forberedelse af data | Rengøring, transformation, integration, normalisering, imputation, støjidentifikation | |
5 | Dataforberedelse i detaljer | Former for dataforberedelse | |
10 | Data Rengøring i detaljer | Fastsættelse eller fjernelse af forkerte, beskadigede, forkert formaterede, duplikerede eller ufuldstændige data i et datasæt | |
10 | Datatransformation i detaljer | Konvertering af data fra et format til et andet, bedste praksis. | |
5 | Data Normalisering i detaljer | Bedste praksis for datanormalisering. | |
5 | Dataintegration i detaljer | Bedste praksis for dataintegration. | |
5 | Datareduktion i detaljer | Bedste praksis for datareduktion. | |
10 | Udarbejdelse af data i praksis | Filtrering, manglende værdier, duplikater, | |
5 | Afsluttende bemærkninger | Understregning af vigtigheden af dataforberedelse. |
Anerkendelser
Programmet Human-Centered AI Masters blev samfinansieret af Connecting Europe-faciliteten i Den Europæiske Union under tilskud CEF-TC-2020-1 Digital Skills 2020-EU-IA-0068.