Administrative oplysninger
Titel | Naturlig sprogbehandling |
Varighed | 60-70 minutter |
Modul | A |
Lektionstype | Forelæsning |
Fokus | Praktisk — modellering af kunstig intelligens |
Emne | Statistiske metoder til NLP- og tekstklassifikation |
Nøgleord
NLP,Natuel sprogbehandling,Computational Lingvistik,
Læringsmål
- Studerende forstår de grundlæggende begreber i Natural Language Processing
- Studerende lærer NLP use cases
- Studerende får kendskab til forskellige NLP-værktøjer og -koncepter
Forventet forberedelse
Læringsbegivenheder, der skal fuldføres før
Ingen.
Obligatorisk for studerende
- En gennemgang af basisstatistikkerne
Valgfrit for studerende
- Anmeldelse af Python programmeringssprog
Referencer og baggrund for studerende
- Etik efter design: Etik Bedste praksis for naturlig sprogbehandling
- Biskop, Christopher M. (2006). Mønstergenkendelse og maskinindlæring
- [https://terpconnect.umd.edu/~kshilton/pdf/VitaketalCSCWpreprint.pdf Beyond the Belmont Principles: Etiske udfordringer, praksis og tro i Online Data Research Community
- Jurafskly D., Martin J. H. — En introduktion til NLP, Computational Linguistics, og talegenkendelse
- Christopher D. Manning, Prabhakar Raghavan og Hinrich Schütze, Introduktion til informationssøgning, Cambridge University Press. 2008.
Undervisningsmaterialer
Instruktioner til lærerne
Du kan basere denne klasse omkring rutsjebanerne. Materialet er foreslået, men kan tilpasses.
Omrids
Varighed (min.) | Beskrivelse | Koncepter | Aktivitet | Materiale |
---|---|---|---|---|
5 | Introduktion til Natural Language Processing, mål, metoder og udfordringer | computerlingvistik, naturlig sprogbehandling | ||
5 | Behandling af naturligt sprogtekst: Use cases | korpus, segmentering, tokenisering, overensstemmelse | ||
10 | Regelmæssige udtryk, Tekstnormalisering | sprogmodellering, rediger afstand | ||
15 | N-gram modeller | Sekvenser af ord som en Markov-proces | ||
5 | Kæderegel for korrekthed | Generel produktregel | ||
10 | Markov og MAximum Sandsynlighedsskøn | Markov kæde — stokastisk model | ||
5 | Evalueringssprogmodeller | Forvirrende | ||
5 | Hoteller i nærheden af Naive Bayes Classifier | Probabilistiske klassifikatorer | Forberedelse af laboratorieudøvelsen |
Anerkendelser
Programmet Human-Centered AI Masters blev samfinansieret af Connecting Europe-faciliteten i Den Europæiske Union under tilskud CEF-TC-2020-1 Digital Skills 2020-EU-IA-0068.