Administratieve informatie
Titel | Natuurlijke taalverwerking |
Looptijd | 60-70 minuten |
Module | A |
Type les | Praktisch |
Focus | Praktisch — AI-modellering |
Onderwerp | Tekstclassificatie, indeling van zinnen |
Sleutelwoorden
Natuurlijke Taalverwerking, Naive Bayes Classifier,
Leerdoelen
- Student begrijpt de basisprincipes van de kern NLP-technieken
- Student maakt kennis met het gebruik van een Naive Bayes Classifier
Verwachte voorbereiding
Leren van gebeurtenissen die moeten worden voltooid voordat
Geen.
Verplicht voor studenten
- Basis Python-programmering
- Basisstatistieken
Optioneel voor studenten
Referenties en achtergronden voor studenten
- Toolkit voor natuurlijke talen
- Christopher D. Manning, Prabhakar Raghavan en Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press. 2008
- Jurafskly D., Martin J.H. — Een inleiding tot NLP, Computational Linguistics en Speech Recognition
Aanbevolen voor docenten
- Toolkit voor natuurlijke talen
- Christopher D. Manning, Prabhakar Raghavan en Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press. 2008
- Jurafskly D., Martin J.H. — Een inleiding tot NLP, Computational Linguistics en Speech Recognition
Lesmateriaal
Instructies voor docenten
Dit leerevenement bestaat uit laboratoriumtaken die door de studenten worden opgelost met de hulp van de leidende instructeur.
Omtrek
Duur (Min) | Omschrijving | Concepten | Activiteit | Materiaal |
---|---|---|---|---|
5 | Woord tokenisatie | |||
5-10 | Pandas DataFrames | |||
10 | Zak met woorden | |||
10 | Tokenisatie met een reguliere expressie | |||
10 | N-gram modellen | |||
5 | Stopwoorden | |||
10-15 | Normalisatie, Stemming en Lemmatisatie | |||
5-10 | Sentiment analyse |
Erkenningen
Het Human-Centered AI Masters-programma werd mede gefinancierd door de Connecting Europe Facility van de Europese Unie in het kader van de subsidie CEF-TC-2020-1 Digital Skills 2020-EU-IA-0068.