Haldusteave
Ametinimetus | Loomuliku keele töötlemine |
Kestus | 60–70 minutit |
Moodul | A |
Õppetunni liik | Praktiline |
Keskendumine | Praktiline – tehisintellekti modelleerimine |
Teema | Teksti klassifikatsioon, Sentiment Klassifikatsioon |
Võtmesõnad
Loomuliku keele töötlemine, Naive Bayes Klassifikaator,
Õpieesmärgid
- Õpilane mõistab põhilisi NLP tehnikaid
- Õpilane tutvub Naive Bayesi klassifikaatori kasutamisega
Eeldatav ettevalmistamine
Õppeüritused, mis tuleb lõpetada enne
Puudub.
Kohustuslik õpilastele
- Pythoni põhiprogrammeerimine
- Põhistatistika
Valikuline õpilastele
Viited ja taust õpilastele
- Loomuliku keele tööriistakomplekt
- Christopher D. Manning, Prabhakar Raghavan ja Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press. 2008
- Jurafskly D., Martin J. H. – Sissejuhatus NLP-sse, arvutuslingvistikasse ja kõnetuvastusse
Soovitatav õpetajatele
- Loomuliku keele tööriistakomplekt
- Christopher D. Manning, Prabhakar Raghavan ja Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press. 2008
- Jurafskly D., Martin J. H. – Sissejuhatus NLP-sse, arvutuslingvistikasse ja kõnetuvastusse
Õppematerjalid
Juhised õpetajatele
See õppeüritus koosneb laboratoorsetest ülesannetest, mille õpilased lahendavad juhtiva instruktori abiga.
Kontuur
Kestus (Min) | Kirjeldus | Mõisted | Tegevus | Materjal |
---|---|---|---|---|
5 | Sõna tokeniseerimine | |||
5–10 | Pandas DataFrames | |||
10 | Märksõnade kott | |||
10 | Tokeniseerimine regulaarse ekspressiooniga | |||
10 | N-gramm mudelid | |||
5 | Stoppsõnad | |||
10–15 | Normaliseerimine, Stemming ja Lemmatization | |||
5–10 | Emotsioonide analüüs |
Tunnustused
Inimkeskse tehisintellekti magistriprogrammi kaasfinantseeris Euroopa Liidu Ühendamise Rahastu toetusega CEF-TC-2020–1 „Digioskused 2020“-EU-IA-0068.