Informations administratives
Titre | Préparation et exploration des données |
Durée | 60 |
Module | A |
Type de leçon | Conférence |
Focus | Pratique — Modélisation de l’IA |
Sujet | Méthodes de préparation des données |
Mots-clés
Préparation des données, Nettoyage des données, Transformation des données, Normalisation des données, Intégration des données, Réduction des données,
Objectifs d’apprentissage
- Pour pouvoir choisir la méthode de préparation des données la plus adaptée en fonction du cas
- préparer les données dans la pratique (gérer les valeurs manquantes, créer de nouvelles fonctionnalités dérivées)
- Enrichissement des données
- Éthique: anonymisation et problèmes avec cela (identification possible de manière indirecte) — là encore, il devrait y avoir quelques exemples
- Imputation — mentionnez qu’elle peut introduire un biais et que cela doit être gardé à l’esprit
- Création de nouvelles fonctionnalités — perte de sémantique appropriée
- Éthique: supprimer le biais de l’ensemble de données
- Parallèles et différences entre l’échantillonnage des données dans les statistiques et l’acquisition de données (y compris les mégadonnées) pour le ML et l’IA
Préparation prévue
Événements d’apprentissage à compléter avant
Obligatoire pour les étudiants
- S.O.
Optionnel pour les étudiants
- S.O.
Références et antécédents pour les étudiants
- S.O.
Recommandé pour les enseignants
Matériel de leçon
Instructions pour les enseignants
Vous pouvez baser cette classe autour des diapositives.
Esquisse
Durée (min) | Description | Concepts | |
---|---|---|---|
5 | Esquisse | Méthodes de préparation des données: quel est le but? | |
5 | Problèmes/Prétraitement | Quels problèmes peuvent avoir les données, le nettoyage, la purification | |
5 | Préparation des données | Nettoyage, transformation, intégration, normalisation, imputation, identification du bruit | |
5 | Préparation des données en détail | Formes de préparation des données | |
10 | Nettoyage des données en détail | Correction ou suppression de données incorrectes, corrompues, mal formatées, dupliquées ou incomplètes dans un ensemble de données | |
10 | Transformation des données en détail | Conversion des données d’un format à un autre, meilleures pratiques. | |
5 | Normalisation des données en détail | Bonnes pratiques en matière de normalisation des données. | |
5 | Intégration des données en détail | Meilleures pratiques en matière d’intégration des données. | |
5 | Réduction des données en détail | Meilleures pratiques en matière de réduction des données. | |
10 | Préparation des données dans la pratique | Filtrage, valeurs manquantes, doublons, | |
5 | Observations finales | Soulignant l’importance de la préparation des données. |
Remerciements
Le programme de master IA centré sur l’humain a été cofinancé par le mécanisme pour l’interconnexion en Europe de l’Union européenne dans le cadre de la subvention CEF-TC-2020-1 Digital Skills 2020-EU-IA-0068.