Administratívne informácie
Názov | Spracovanie prirodzeného jazyka |
Trvanie | 60 – 70 minút |
Modul | A |
Druh lekcie | Prednáška |
Zameranie | Praktické – modelovanie umelej inteligencie |
Téma | Štatistické metódy pre NLP a textovú klasifikáciu |
Kľúčové slová
NLP,Spracovanie národného jazyka, Výpočtová lingvistika,
Vzdelávacie ciele
- Študenti rozumejú základným konceptom spracovania prirodzeného jazyka
- Študenti sa učia prípady používania NLP
- Študenti sa oboznámia s rôznymi nástrojmi a konceptmi NLP
Očakávaná príprava
Naučte sa udalosti, ktoré treba dokončiť predtým
Žiadne.
Povinné pre študentov
- Prehľad základných štatistík
Voliteľné pre študentov
- Pôvodný názov: Python Programming Language
Referencie a zázemie pre študentov
- Etika podľa dizajnu: Etika Najlepšie postupy pre spracovanie prirodzeného jazyka
- Biskup, Christopher M. (2006). Rozpoznávanie vzorov a strojové učenie
- [https://terpconnect.umd.edu/~kshilton/pdf/VitaketalCSCWpreprint.pdf Beyond the Belmont Principles: Etické výzvy, postupy a presvedčenia v komunite pre výskum údajov online]
- Jurafskly D., Martin J. H. – Úvod do NLP, výpočtovej lingvistiky a rozpoznávania reči
- Christopher D. Manning, Prabhakar Raghavan a Hinrich Schütze, úvod do vyhľadávania informácií, Cambridge University Press. 2008.
Odporúčané pre učiteľov
Učebné materiály
Pokyny pre učiteľov
Túto triedu môžete založiť na snímkach. Materiál je navrhnutý, ale môže byť upravený.
Obrysy
Trvanie (Min) | Popis | Koncepty | Činnosť | Materiál |
---|---|---|---|---|
5 | Úvod do spracovania prirodzeného jazyka, cieľov, metód a výziev | počítačová lingvistika, spracovanie prirodzeného jazyka | ||
5 | Spracovanie textu prirodzeného jazyka: Prípady použitia | korpus, segmentácia, tokenizácia, zhoda | ||
10 | Pravidelné výrazy, normalizácia textu | jazykové modelovanie, upravte vzdialenosť | ||
15 | N-gramové modely | Sekvencie slov ako Markovov proces | ||
5 | Reťazové pravidlo pravdepodobnosti | Všeobecné pravidlo o výrobku | ||
10 | Markov a MAximum odhad pravdepodobnosti | Markov reťaz – stochastický model | ||
5 | Hodnotiace jazykové modely | Zmätenosť | ||
5 | Naivný Bayes klasifikátor | Pravdepodobnostné klasifikátory | Príprava laboratórnej excercise |
Uznania
Program Masters umelej inteligencie zameraný na človeka bol spolufinancovaný z Nástroja Európskej únie na prepájanie Európy v rámci grantu CEF-TC-2020 – 1 Digitálne zručnosti 2020-EU-IA-0068.