Haldusteave
Ametinimetus | Loomuliku keele töötlemine |
Kestus | 60–70 minutit |
Moodul | A |
Õppetunni liik | Loeng |
Keskendumine | Praktiline – tehisintellekti modelleerimine |
Teema | NLP statistilised meetodid ja teksti klassifitseerimine |
Võtmesõnad
NLP, Natual Language Processing,Computational Linguistics,
Õpieesmärgid
- Õpilased mõistavad looduskeele töötlemise põhimõisteid
- Õpilased õpivad NLP kasutusjuhtumeid
- Õpilased tutvuvad erinevate NLP tööriistade ja kontseptsioonidega
Eeldatav ettevalmistamine
Õppeüritused, mis tuleb lõpetada enne
Puudub.
Kohustuslik õpilastele
- Ülevaade põhistatistikast
Valikuline õpilastele
- Pythoni programmeerimiskeele ülevaade
Viited ja taust õpilastele
- Eetiline disain: Eetika parimad tavad loomuliku keele töötlemiseks
- Piiskop Christopher M. (2006). Mustrite äratundmine ja masinõpe
- [https://terpconnect.umd.edu/~kshilton/pdf/VitaketalCSCWpreprint.pdf Beyond the Belmont’i põhimõtted: Eetilisi väljakutseid, tavasid ja uskumusi veebiandmekogukonnas]
- Jurafskly D., Martin J. H. – Sissejuhatus NLP-sse, arvutuslingvistikasse ja kõnetuvastusse
- Christopher D. Manning, Prabhakar Raghavan ja Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press. 2008.
Soovitatav õpetajatele
Õppematerjalid
Juhised õpetajatele
Selle klassi saab paigutada slaidide ümber. Materjal on soovitatav, kuid seda saab kohandada.
Kontuur
Kestus (Min) | Kirjeldus | Mõisted | Tegevus | Materjal |
---|---|---|---|---|
5 | Sissejuhatus Loomuliku Keele Töötlemine, eesmärgid, meetodid ja väljakutsed | arvutilingvistika, loomulik keeletöötlus | ||
5 | Loomuliku keele töötlemine Tekst: Kasutusjuhtumid | korpus, segmenteerimine, tokeniseerimine, vastavus | ||
10 | Regulaarsed väljendusviisid, teksti normaliseerimine | keele modelleerimine, redigeerimiskaugus | ||
15 | N-gramm mudelid | Sõnade järjestused Markovi protsessina | ||
5 | Probality’i ahelreegel | Toote üldreegel | ||
10 | Markov ja MAximum tõenäosuse hindamine | Markovi kett – stohhastiline mudel | ||
5 | Hindamise keelemudelid | Hägusus | ||
5 | Naive Bayes klassifitseerija | Tõenäosuslikud klassifitseerijad | Labori harjutuste ettevalmistamine |
Tunnustused
Inimkeskse tehisintellekti magistriprogrammi kaasfinantseeris Euroopa Liidu Ühendamise Rahastu toetusega CEF-TC-2020–1 „Digioskused 2020“-EU-IA-0068.