Informazioni amministrative
Titolo | Preparazione ed esplorazione dei dati |
Durata | 60 |
Modulo | A |
Tipo di lezione | Lezione |
Focus | Pratiche — AI Modelling |
Argomento | Metodi di preparazione dei dati |
Parole chiave
Preparazione dei dati, pulizia dei dati, trasformazione dei dati, normalizzazione dei dati, integrazione dei dati, riduzione dei dati,
Obiettivi di apprendimento
- Per poter scegliere il metodo di preparazione dei dati più adatto in base al caso
- preparare i dati nella pratica (maneggiare i valori mancanti, creare nuove caratteristiche derivate)
- Arricchimento dei dati
- Etica: anonimizzazione e problemi con questo (identificazione possibile in modi indiretti) — ancora una volta, ci dovrebbero essere alcuni esempi là fuori
- Imputazione — menzionare che può introdurre pregiudizi e che questo deve essere tenuto a mente
- Creazione di nuove funzionalità — perdita di semantica corretta
- Etica: rimuovere bias dal set di dati
- Parallelismi e differenze tra il campionamento dei dati nelle statistiche e l'acquisizione di dati (compresi i big data) per il ML e l'IA
Preparazione prevista
Eventi di apprendimento da completare prima
Obbligatorio per gli studenti
- N/A
Facoltativo per gli studenti
- N/A
Referenze e background per gli studenti
- N/A
Consigliato per gli insegnanti
Materiale didattico
Istruzioni per gli insegnanti
Puoi basare questa classe intorno alle diapositive.
Contorno
Durata (min) | Descrizione | Concetti | |
---|---|---|---|
5 | Contorno | Metodi di preparazione dei dati: qual è il punto? | |
5 | Problemi/pretrattamento | Quali problemi possono avere i dati, pulizia, purificazione | |
5 | Preparazione dei dati | Pulizia, trasformazione, integrazione, normalizzazione, imputazione, identificazione del rumore | |
5 | Preparazione dei dati in dettaglio | Forme di preparazione dei dati | |
10 | Pulizia dei dati in dettaglio | Correggere o rimuovere dati errati, corrotti, formattati in modo errato, duplicati o incompleti all'interno di un set di dati | |
10 | Trasformazione dei dati in dettaglio | Conversione dei dati da un formato all'altro, best practice. | |
5 | Normalizzazione dei dati in dettaglio | Migliori pratiche di normalizzazione dei dati. | |
5 | Integrazione dei dati in dettaglio | Migliori pratiche per l'integrazione dei dati. | |
5 | Riduzione dei dati in dettaglio | Migliori pratiche per la riduzione dei dati. | |
10 | Preparazione dei dati nella pratica | Filtraggio, valori mancanti, duplicati, | |
5 | Osservazioni conclusive | Sottolineando l'importanza della preparazione dei dati. |
Riconoscimenti
Il programma Human-Centered AI Masters è stato co-finanziato dal meccanismo per collegare l'Europa dell'Unione europea nell'ambito della sovvenzione CEF-TC-2020-1 Digital Skills 2020-EU-IA-0068.