[cette page sur wiki][index][EN][BG][CS][DA][DE][EL][ES][ET][FI][FR][GA][HR][HU][IT][MT][NL][PL][PT][RO][SK][SL][SV]

Conférence: Traitement du langage naturel

Informations administratives

Titre Traitement du langage naturel
Durée 60-70 minutes
Module A
Type de leçon Conférence
Focus Pratique — Modélisation de l’IA
Sujet Méthodes statistiques pour la PNL et la classification des textes

Mots-clés

NLP, Traitement du langage natuel, linguistique informatique,

Objectifs d’apprentissage

Préparation prévue

Événements d’apprentissage à compléter avant

Aucun.

Obligatoire pour les étudiants

  • Examen des statistiques de base

Optionnel pour les étudiants

  • Revue du langage de programmation Python

Références et antécédents pour les étudiants

  • Éthique par conception: Bonnes pratiques éthiques pour le traitement du langage naturel
  • Évêque, Christopher M. (2006). Reconnaissance des modèles et apprentissage automatique
  • [ https://terpconnect.umd.edu/~kshilton/pdf/VitaketalCSCWpreprint.pdfAu -delà des principes de Belmont: Défis éthiques, pratiques et croyances dans la communauté de recherche sur les données en ligne]
  • Jurafskly D., Martin J. H. — Introduction à la PNL, à la linguistique informatique et à la reconnaissance de la parole
  • Christopher D. Manning, Prabhakar Raghavan et Hinrich Schütze, Introduction à la recherche d’informations, Cambridge University Press. 2008.

Matériel de leçon

Instructions pour les enseignants

Vous pouvez baser cette classe autour des diapositives. Le matériel est suggéré mais peut être adapté.

Esquisse

Calendrier
Durée (min) Description Concepts Activité Matériel
5 Introduction au traitement du langage naturel, objectifs, méthodes et défis linguistique informatique, traitement du langage naturel
5 Traitement du langage naturel Texte: Cas d’utilisation corpus, segmentation, tokenisation, concordance
10 Expressions régulières, Normalisation du texte modélisation linguistique, modification de la distance
15 Modèles N-gram Séquences de mots comme processus de Markov
5 Règle de chaîne de la Probalité Règle générale du produit
10 Estimation de la probabilité de Markov et de MAximum Chaîne Markov — modèle stochastique
5 Modèles linguistiques d’évaluation Perplexité
5 Classificateur naïf Bayes Classificateurs probabilistes Préparation de l’excercise de laboratoire

Remerciements

Le programme de master IA centré sur l’humain a été cofinancé par le mécanisme pour l’interconnexion en Europe de l’Union européenne dans le cadre de la subvention CEF-TC-2020-1 Digital Skills 2020-EU-IA-0068.