Informações administrativas
Titulo | Processamento de Linguagem Natural |
Duração | 60 — 70 minutos |
Módulo | A |
Tipo de aula | Palestra |
Foco | Prático — Modelação de IA |
Tópico | Métodos estatísticos para a PNL e classificação de texto |
Palavras-chave
NLP,N Atual Linguística, Linguística Computacional,
Objetivos de aprendizagem
- Os alunos compreendem os conceitos básicos de processamento de linguagem natural
- Os alunos aprendem casos de utilização da PNL
- Os alunos familiarizam-se com várias ferramentas e conceitos de PNL
Preparação prevista
Eventos de aprendizagem a serem concluídos antes
Nenhuma.
Obrigatório para os Estudantes
- Uma revisão das estatísticas básicas
Facultativo para Estudantes
- Revisão da linguagem de programação Python
Referências e antecedentes para estudantes
- Ética por Desenho: Ética Melhores Práticas para o Processamento de Linguagem Natural
- Bishop, Christopher M. (2006). Reconhecimento de padrões e aprendizagem automática
- [https://terpconnect.umd.edu/~kshilton/pdf/VitaketalCSCWpreprint.pdf Além dos Princípios de Belmont: Desafios éticos, práticas e crenças na comunidade de pesquisa de dados online]
- Jurafskly D., Martin J. H. — Uma Introdução à PNL, Linguística Computacional e Reconhecimento da Fala
- Christopher D. Manning, Prabhakar Raghavan e Hinrich Schütze, Introdução à Recuperação da Informação, Cambridge University Press. 2008.
Recomendado para professores
Materiais das aulas
Instruções para os professores
Podes basear esta aula à volta dos slides. O material é sugerido, mas pode ser adaptado.
Esboço
Duração (Min) | Descrição | Conceitos | Atividade | Materiais |
---|---|---|---|---|
5 | Introdução ao Processamento da Linguagem Natural, objetivos, métodos e desafios | linguística informática, processamento de linguagem natural | ||
5 | Processamento de Texto da Linguagem Natural: Casos de utilização | corpus, segmentação, tokenização, concordância | ||
10 | Expressões Regulares, Normalização do Texto | modelagem linguística, editar distância | ||
15 | N-grama Modelos | Sequências de palavras como processo de Markov | ||
5 | Regra da Cadeia da Probalidade | Regra geral relativa aos produtos | ||
10 | Markov e a estimativa da probabilidade de Maximum | Cadeia de Markov — modelo estocástico | ||
5 | Modelos de Linguagem de Avaliação | Perplexidade | ||
5 | Classificador de Bayes ingénuos | Classificadores probabilísticos | Preparação do excercício do laboratório |
Agradecimentos
O programa de mestrado em IA centrado no ser humano foi cofinanciado pelo Mecanismo Interligar a Europa da União Europeia ao abrigo de subvenções CEF-TC-2020-1 Competências Digitais 2020-EU-IA-0068.