Administrativ information
Titel | Naturlig språkbehandling |
Varaktighet | 60–70 minuter |
Modul | A |
Typ av lektion | Praktiskt |
Fokus | Praktiskt – AI-modellering |
Ämne | Textklassificering, Sentimentklassificering |
Nyckelord
Naturlig språkbehandling,Naive Bayes Classifier,
Lärandemål
- Studenten kommer att förstå grunderna i kärn NLP tekniker
- Studenten blir bekant med användningen av en Naive Bayes Classifier
Förväntad förberedelse
Lärande händelser som ska slutföras innan
Ingen.
Obligatoriskt för studenter
- Grundläggande Python-programmering
- Grundläggande statistik
Valfritt för studenter
Referenser och bakgrund för studenter
- Verktygslåda för naturligt språk
- Christopher D. Manning, Prabhakar Raghavan och Hinrich Schütze, Introduktion till Information Retrieval, Cambridge University Press. 2008
- Jurafskly D., Martin J. H. – En introduktion till NLP, Computational Linguistics och Speech Recognition
Rekommenderas för lärare
- Verktygslåda för naturligt språk
- Christopher D. Manning, Prabhakar Raghavan och Hinrich Schütze, Introduktion till Information Retrieval, Cambridge University Press. 2008
- Jurafskly D., Martin J. H. – En introduktion till NLP, Computational Linguistics och Speech Recognition
Lektionsmaterial
Instruktioner för lärare
Denna inlärningshändelse består av laboratorieuppgifter som ska lösas av eleverna med hjälp av den ledande instruktören.
Konturer
Varaktighet (min) | Beskrivning | Begrepp | Verksamhet | Material |
---|---|---|---|---|
5 | Ordtokenisering | |||
5–10 | Pandor DataFrames | |||
10 | Väska med ord | |||
10 | Tokenisering med ett vanligt uttryck | |||
10 | N-gram modeller | |||
5 | Stoppord | |||
10–15 | Normalisering, Stemming och Lemmatization | |||
5–10 | Sentimentanalys |
Erkännanden
Masterprogrammet Human-Centered AI har samfinansierats av Fonden för ett sammanlänkat Europa i Europeiska unionen inom ramen för Grant CEF-TC-2020–1 Digital Skills 2020 EU-IA-0068.