Administratieve informatie
Titel | Natuurlijke taalverwerking |
Looptijd | 60-70 minuten |
Module | A |
Type les | Lezing |
Focus | Praktisch — AI-modellering |
Onderwerp | Statistische methoden voor NLP en tekstclassificatie |
Sleutelwoorden
NLP,Natual Language Processing,Computational Linguistics,
Leerdoelen
- Studenten begrijpen de basisbegrippen van natuurlijke taalverwerking
- Studenten leren NLP use cases
- Studenten maken kennis met verschillende NLP tools en concepten
Verwachte voorbereiding
Leren van gebeurtenissen die moeten worden voltooid voordat
Geen.
Verplicht voor studenten
- Een overzicht van de basisstatistieken
Optioneel voor studenten
- Overzicht van Python Programming Language
Referenties en achtergronden voor studenten
- Ethisch door ontwerp: Ethische Best Practices voor Natuurlijke Taalverwerking
- Bishop, Christopher M. (2006). Patroonherkenning en machine learning
- [https://terpconnect.umd.edu/~kshilton/pdf/VitaketalCSCWpreprint.pdf voorbij de Belmont-principes: Ethische uitdagingen, praktijken en overtuigingen in de online gegevensonderzoeksgemeenschap]
- Jurafskly D., Martin J.H. — Een inleiding tot NLP, Computational Linguistics en Speech Recognition
- Christopher D. Manning, Prabhakar Raghavan en Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press. 2008.
Lesmateriaal
Instructies voor docenten
U kunt deze klasse rond de dia’s baseren. Het materiaal wordt voorgesteld, maar kan worden aangepast.
Omtrek
Duur (Min) | Omschrijving | Concepten | Activiteit | Materiaal |
---|---|---|---|---|
5 | Inleiding tot Natural Language Processing, doelen, methoden en uitdagingen | computertaalkunde, natuurlijke taalverwerking | ||
5 | Verwerking van de tekst van de natuurlijke taal; Use cases | corpus, segmentatie, tokenisatie, concordantie | ||
10 | Regelmatige expressies, tekstnormalisatie | taalmodellering, bewerk afstand | ||
15 | N-gram modellen | Sequenties van woorden als een Markov-proces | ||
5 | Ketenregel van Probaliteit | Algemene productregel | ||
10 | Markov en MAximum Likelihood Estimation | Markov ketting — stochastisch model | ||
5 | Evaluatietaalmodellen | Perplexiteit | ||
5 | Naïeve Bayes Classifier | Probabilistische classificatoren | Voorbereiding van de labexcercise |
Erkenningen
Het Human-Centered AI Masters-programma werd mede gefinancierd door de Connecting Europe Facility van de Europese Unie in het kader van de subsidie CEF-TC-2020-1 Digital Skills 2020-EU-IA-0068.