Informații administrative
Titlu | Pregătirea și explorarea datelor |
Durată | 60 |
Modulul | A |
Tipul lecției | Prelegere |
Focalizare | Practică – Modelarea IA |
Subiect | Metode de pregătire a datelor |
Cuvinte cheie
Pregătirea datelor, Curățarea datelor, Transformarea datelor, Normalizarea datelor, Integrarea datelor, Reducerea datelor,
Obiective de învățare
- Pentru a putea alege cea mai potrivită metodă de pregătire a datelor pe baza cazului
- pregătiți datele în practică (cu ajutorul valorilor lipsă, creați noi caracteristici derivate)
- Îmbogățirea datelor
- Etică: anonimizarea și problemele legate de acest lucru (identificare posibilă în moduri indirecte) – din nou, ar trebui să existe câteva exemple acolo
- Imputare – menționăm că poate introduce prejudecăți și că acest lucru trebuie avut în vedere
- Crearea de noi caracteristici – pierderea semanticii adecvate
- Etică: eliminați părtinirea din setul de date
- Paralele și diferențe între eșantionarea datelor din statistici și achiziționarea de date (inclusiv volume mari de date) pentru ML și IA
Pregătirea preconizată
Evenimente de învățare care urmează să fie finalizate înainte
Obligatoriu pentru studenți
- N/A
Opțional pentru studenți
- N/A
Referințe și context pentru studenți
- N/A
Recomandat pentru profesori
Materiale de lecție
Instrucțiuni pentru profesori
Puteți baza această clasă în jurul diapozitivelor.
Contur
Durată (min) | Descriere | Concepte | |
---|---|---|---|
5 | Contur | Metode de pregătire a datelor: ce rost are? | |
5 | Probleme/Preprocesare | Ce probleme pot avea datele, curățarea, purificarea | |
5 | Pregătirea datelor | Curățarea, transformarea, integrarea, normalizarea, imputarea, identificarea zgomotului | |
5 | Pregătirea datelor în detaliu | Forme de pregătire a datelor | |
10 | Curățarea datelor în detaliu | Fixarea sau eliminarea datelor incorecte, corupte, formatate incorect, duplicate sau incomplete dintr-un set de date | |
10 | Transformarea datelor în detaliu | Conversia datelor de la un format la altul, cele mai bune practici. | |
5 | Standardizarea datelor în detaliu | Cele mai bune practici de normalizare a datelor. | |
5 | Integrarea datelor în detaliu | Cele mai bune practici de integrare a datelor. | |
5 | Reducerea datelor în detaliu | Cele mai bune practici de reducere a datelor. | |
10 | Pregătirea datelor în practică | Filtrare, valori lipsă, duplicate, | |
5 | Observații finale | Evidențierea importanței pregătirii datelor. |
Confirmări
Programul de masterat AI centrat pe om a fost cofinantat de Mecanismul pentru interconectarea Europei al Uniunii Europene sub Grantul CEF-TC-2020-1 Digital Skills 2020-EU-IA-0068.