Información administrativa
Título | Procesamiento del lenguaje natural |
Duración | 60-70 minutos |
Módulo | A |
Tipo de lección | Conferencia |
Enfoque | Práctico — Modelado de IA |
Tema | Métodos estadísticos para la PNL y la clasificación de textos |
Keywords
PNL, Procesamiento del lenguaje natural, Lingüística computacional,
Objetivos de aprendizaje
- Los estudiantes entienden los conceptos básicos del procesamiento del lenguaje natural
- Los estudiantes aprenden casos de uso de PNL
- Los estudiantes se familiarizan con varias herramientas y conceptos de PNL
Preparación prevista
Eventos de aprendizaje que se completarán antes
Ninguno.
Obligatorio para los estudiantes
- Revisión de las estadísticas básicas
Opcional para estudiantes
- Revisión del lenguaje de programación Python
Referencias y antecedentes para estudiantes
- Ética por diseño: Mejores prácticas éticas para el procesamiento del lenguaje natural
- Obispo, Christopher M. (2006). Reconocimiento de patrones y aprendizaje automático
- [ https://terpconnect.umd.edu/~kshilton/pdf/VitaketalCSCWpreprint.pdfMás allá de los Principios de Belmont: Desafíos éticos, prácticas y creencias en la comunidad de investigación de datos en línea]
- Jurafskly D., Martin J. H. — Introducción a la PNL, Lingüística Computacional y Reconocimiento del Discurso
- Christopher D. Manning, Prabhakar Raghavan y Hinrich Schütze, Introducción a la recuperación de información, Cambridge University Press. 2008.
Recomendado para profesores
Material didáctico
Instrucciones para profesores
Puedes basar esta clase alrededor de las diapositivas. Se sugiere el material, pero se puede adaptar.
Esquema
Duración (Min) | Descripción | Conceptos | Actividad | Material |
---|---|---|---|---|
5 | Introducción al procesamiento del lenguaje natural, objetivos, métodos y desafíos | lingüística informática, procesamiento del lenguaje natural | ||
5 | Procesamiento del lenguaje natural Texto: Casos de uso | corpus, segmentación, tokenización, concordancia | ||
10 | Expresiones regulares, normalización del texto | modelado de idiomas, edición de distancia | ||
15 | Modelos de N-gram | Secuencias de palabras como un proceso de Markov | ||
5 | Regla de la Probalidad de la Cadena | Regla general del producto | ||
10 | Estimación de la probabilidad máxima de Markov y Máximum | Cadena Markov — modelo estocástico | ||
5 | Modelos de idiomas de evaluación | Perplejidad | ||
5 | Clasificador ingenuo de Bayes | Clasificadores probabilísticos | Preparación del ejercicio de laboratorio |
Reconocimientos
El programa de maestría en IA centrada en el ser humano fue cofinanciado por el Mecanismo «Conectar Europa» de la Unión Europea en virtud de la subvención «CEF-TC-2020-1 Digital Skills 2020-EU-IA-0068».