Informations administratives
Titre | Traitement du langage naturel |
Durée | 60-70 minutes |
Module | A |
Type de leçon | Conférence |
Focus | Pratique — Modélisation de l’IA |
Sujet | Méthodes statistiques pour la PNL et la classification des textes |
Mots-clés
NLP, Traitement du langage natuel, linguistique informatique,
Objectifs d’apprentissage
- Les étudiants comprennent les concepts de base du traitement du langage naturel
- Les élèves apprennent les cas d’utilisation de la PNL
- Les étudiants se familiarisent avec divers outils et concepts de PNL
Préparation prévue
Événements d’apprentissage à compléter avant
Aucun.
Obligatoire pour les étudiants
- Examen des statistiques de base
Optionnel pour les étudiants
- Revue du langage de programmation Python
Références et antécédents pour les étudiants
- Éthique par conception: Bonnes pratiques éthiques pour le traitement du langage naturel
- Évêque, Christopher M. (2006). Reconnaissance des modèles et apprentissage automatique
- [ https://terpconnect.umd.edu/~kshilton/pdf/VitaketalCSCWpreprint.pdfAu -delà des principes de Belmont: Défis éthiques, pratiques et croyances dans la communauté de recherche sur les données en ligne]
- Jurafskly D., Martin J. H. — Introduction à la PNL, à la linguistique informatique et à la reconnaissance de la parole
- Christopher D. Manning, Prabhakar Raghavan et Hinrich Schütze, Introduction à la recherche d’informations, Cambridge University Press. 2008.
Recommandé pour les enseignants
Matériel de leçon
Instructions pour les enseignants
Vous pouvez baser cette classe autour des diapositives. Le matériel est suggéré mais peut être adapté.
Esquisse
Durée (min) | Description | Concepts | Activité | Matériel |
---|---|---|---|---|
5 | Introduction au traitement du langage naturel, objectifs, méthodes et défis | linguistique informatique, traitement du langage naturel | ||
5 | Traitement du langage naturel Texte: Cas d’utilisation | corpus, segmentation, tokenisation, concordance | ||
10 | Expressions régulières, Normalisation du texte | modélisation linguistique, modification de la distance | ||
15 | Modèles N-gram | Séquences de mots comme processus de Markov | ||
5 | Règle de chaîne de la Probalité | Règle générale du produit | ||
10 | Estimation de la probabilité de Markov et de MAximum | Chaîne Markov — modèle stochastique | ||
5 | Modèles linguistiques d’évaluation | Perplexité | ||
5 | Classificateur naïf Bayes | Classificateurs probabilistes | Préparation de l’excercise de laboratoire |
Remerciements
Le programme de master IA centré sur l’humain a été cofinancé par le mécanisme pour l’interconnexion en Europe de l’Union européenne dans le cadre de la subvention CEF-TC-2020-1 Digital Skills 2020-EU-IA-0068.