Administrativ information
| Titel | Naturlig språkbehandling |
| Varaktighet | 60–70 minuter |
| Modul | A |
| Typ av lektion | Praktiskt |
| Fokus | Praktiskt – AI-modellering |
| Ämne | Textklassificering, Sentimentklassificering |
Nyckelord
Naturlig språkbehandling,Naive Bayes Classifier,
Lärandemål
- Studenten kommer att förstå grunderna i kärn NLP tekniker
- Studenten blir bekant med användningen av en Naive Bayes Classifier
Förväntad förberedelse
Lärande händelser som ska slutföras innan
Ingen.
Obligatoriskt för studenter
- Grundläggande Python-programmering
- Grundläggande statistik
Valfritt för studenter
Referenser och bakgrund för studenter
- Verktygslåda för naturligt språk
- Christopher D. Manning, Prabhakar Raghavan och Hinrich Schütze, Introduktion till Information Retrieval, Cambridge University Press. 2008
- Jurafskly D., Martin J. H. – En introduktion till NLP, Computational Linguistics och Speech Recognition
Rekommenderas för lärare
- Verktygslåda för naturligt språk
- Christopher D. Manning, Prabhakar Raghavan och Hinrich Schütze, Introduktion till Information Retrieval, Cambridge University Press. 2008
- Jurafskly D., Martin J. H. – En introduktion till NLP, Computational Linguistics och Speech Recognition
Lektionsmaterial
Instruktioner för lärare
Denna inlärningshändelse består av laboratorieuppgifter som ska lösas av eleverna med hjälp av den ledande instruktören.
Konturer
| Varaktighet (min) | Beskrivning | Begrepp | Verksamhet | Material |
|---|---|---|---|---|
| 5 | Ordtokenisering | |||
| 5–10 | Pandor DataFrames | |||
| 10 | Väska med ord | |||
| 10 | Tokenisering med ett vanligt uttryck | |||
| 10 | N-gram modeller | |||
| 5 | Stoppord | |||
| 10–15 | Normalisering, Stemming och Lemmatization | |||
| 5–10 | Sentimentanalys |
Erkännanden
Masterprogrammet Human-Centered AI har samfinansierats av Fonden för ett sammanlänkat Europa i Europeiska unionen inom ramen för Grant CEF-TC-2020–1 Digital Skills 2020 EU-IA-0068.
