Administrativ information
Titel | Dataförberedelse och undersökning |
Varaktighet | 60 |
Modul | A |
Typ av lektion | Föreläsning |
Fokus | Praktiskt – AI-modellering |
Ämne | Metoder för beredning av uppgifter |
Nyckelord
Dataförberedelse, datarengöring, dataomvandling, datanormalisering, dataintegration, datareducering,
Lärandemål
- För att kunna välja den mest lämpade databeredningsmetoden baserat på ärendet
- förbereda data i praktiken (hantera saknade värden, skapa nya härledda funktioner)
- Uppgiftsberikning
- Etiskt: anonymisering och problem med detta (identifiering möjlig indirekt) – återigen bör det finnas några exempel där ute
- Imputation – nämna att det kan införa bias och att detta måste hållas i åtanke
- Ny funktionsskapande – förlust av korrekt semantik
- Etiskt: ta bort bias från datamängden
- Paralleller och skillnader mellan urval av uppgifter i statistik och insamling av data (inklusive stordata) för ML och AI
Förväntad förberedelse
Lärande händelser som ska slutföras innan
Obligatoriskt för studenter
- EJ TILLÄMPLIGT
Valfritt för studenter
- EJ TILLÄMPLIGT
Referenser och bakgrund för studenter
- EJ TILLÄMPLIGT
Rekommenderas för lärare
Lektionsmaterial
Instruktioner för lärare
Du kan basera den här klassen runt diabilderna.
Konturer
Längd (min) | Beskrivning | Begrepp | |
---|---|---|---|
5 | Konturer | Metoder för beredning av uppgifter: vad är poängen? | |
5 | Problem/förbehandling | Vilka problem kan data ha, rengöring, rening | |
5 | Beredning av uppgifter | Rengöring, omvandling, integration, normalisering, imputation, bulleridentifiering | |
5 | Dataförberedelse i detalj | Former av databeredning | |
10 | Datarengöring i detalj | Fastställande eller borttagning av felaktiga, skadade, felaktigt formaterade, duplicerade eller ofullständiga data i ett dataset | |
10 | Datatransformation i detalj | Konvertera data från ett format till ett annat, bästa praxis. | |
5 | Datanormalisering i detalj | Bästa praxis för datanormalisering. | |
5 | Dataintegration i detalj | Bästa praxis för dataintegration. | |
5 | Dataminskning i detalj | Bästa praxis för att minska data. | |
10 | Utarbetande av data i praktiken | Filtrering, saknade värden, dubbletter, | |
5 | Avslutande anmärkningar | Betonar vikten av att förbereda data. |
Erkännanden
Masterprogrammet Human-Centered AI har samfinansierats av Fonden för ett sammanlänkat Europa i Europeiska unionen inom ramen för Grant CEF-TC-2020–1 Digital Skills 2020 EU-IA-0068.