Informations administratives
Titre | Arbres de décision |
Durée | 2 x 45 minutes |
Module | A |
Type de leçon | Pratique |
Focus | Pratique — Modélisation de l’IA |
Sujet | Analyse des données |
Mots-clés
Génération d’ensembles de données, montage, complexité du modèle,
Objectifs d’apprentissage
- apprendre les bases des arbres de décision
Préparation prévue
Événements d’apprentissage à compléter avant
Obligatoire pour les étudiants
- Conférence: Préparation et exploration des données
- Session de laboratoire: Préparation et exploration des données
Optionnel pour les étudiants
Aucun.
Références et antécédents pour les étudiants
- Scikit-Learn
- Keras
- Arbre de décision sur wikipedia
- Ron Kohavi, «Améliorer l’exactitude des classificateurs Naive-Bayes: a Decision-Tree Hybrid», Proceedings of the Second International Conference on Knowledge Discovery and Data Mining, 1996.
- https://scikit-learn.org/stable/modules/tree.html
- https://pulplearning.altervista.org/algoritmi-di-machine-learning-decision-tree/
- https://www.kaggle.com/code/hamelg/python-for-data-29-decision-trees/notebook
- https://towardsdatascience.com/decision-trees-in-machine-learning-641b9c4e8052
Recommandé pour les enseignants
Aucun.
Matériel de leçon
Instructions pour les enseignants
Cet événement d’apprentissage consiste en des tâches de laboratoire qui seront résolues par les étudiants avec l’aide de l’instructeur principal.
Vous pouvez baser cette classe autour des carnets.
Plan/horaire[modifier | modifier la source]
Durée (min) | Description | Concepts | Activité | Matériel |
---|---|---|---|---|
5 | Résumé des tâches à accomplir | Introduction | Conférence | |
5 | Génération d’un ensemble de données bidimensionnels | Bruit gaussien, np.random.randn | Codage | Carnet de notes Jupyter |
10 | Montage et évaluation d’un arbre de décision | scikit-learn | Codage | |
15 | Étude de l’effet du paramètre de complexité du modèle | complexité du modèle, vecteurs de support, marge, tracé | Documentation | |
5 | Montage du modèle | Montage du modèle | Codage | |
15 | Évaluer et investiguer l’effet du paramètre | Évaluation des paramètres | Documentation | |
20 | Mise en œuvre d’un modèle précalculé personnalisé | opérations matricielles en numpy | Codage | |
45 | Montage et évaluation du modèle sur des données réelles | prétraitement des données (scaling), Précision, Matrice de confusion, Validation croisée | Documentation |
Remerciements
Le programme de master IA centré sur l’humain a été cofinancé par le mécanisme pour l’interconnexion en Europe de l’Union européenne dans le cadre de la subvention CEF-TC-2020-1 Digital Skills 2020-EU-IA-0068.