Administrativní informace
Název | Zpracování přirozeného jazyka |
Trvání | 60–70 minut |
Modul | A |
Typ lekce | Přednáška |
Soustředění | Praktické – modelování umělé inteligence |
Téma | Statistické metody pro NLP a textovou klasifikaci |
Klíčová slova
NLP,Natual Language Processing, Výpočetní lingvistika,
Vzdělávací cíle
- Studenti chápou základní pojmy zpracování přirozeného jazyka
- Studenti se učí případy použití NLP
- Studenti se seznámí s různými nástroji a koncepty NLP
Očekávaná příprava
Vzdělávací akce, které mají být dokončeny před
Žádné.
Povinné pro studenty
- Přehled základních statistik
Volitelné pro studenty
- Přehled programovacího jazyka Python
Reference a zázemí pro studenty
- Etika od návrhu: Etické osvědčené postupy pro zpracování přirozeného jazyka
- Biskup, Christopher M. (2006). Rozpoznávání vzorů a strojové učení
- [https://terpconnect.umd.edu/~kshilton/pdf/VitaketalCSCWpreprint.pdf Beyond the Belmont Principles: Etické výzvy, praxe a přesvědčení v komunitě pro výzkum online dat]
- Jurafskly D., Martin J. H. – Úvod do NLP, výpočetní lingvistika a rozpoznávání řeči
- Manning, Prabhakar Raghavan a Hinrich Schütze, Úvod do vyhledávání informací, Cambridge University Press. 2008.
Doporučeno pro učitele
Materiály pro výuku
Pokyny pro učitele
Tuto třídu můžete založit kolem skluzavek. Materiál je navržen, ale lze jej přizpůsobit.
Obrys
Doba trvání (Min) | Popis | Koncepty | Aktivity | Materiál |
---|---|---|---|---|
5 | Úvod do zpracování přirozeného jazyka, cíle, metody a výzvy | počítačová lingvistika, zpracování přirozeného jazyka | ||
5 | Zpracování textu přirozeného jazyka: Případy použití | korpus, segmentace, tokenizace, konkordance | ||
10 | Pravidelné výrazy, normalizace textu | jazykové modelování, editační vzdálenost | ||
15 | N-gramové modely | Sekvence slov jako Markovův proces | ||
5 | Řetězové pravidlo pravděpodobnosti | Obecné produktové pravidlo | ||
10 | Markov a MAximum odhad pravděpodobnosti | Markov řetěz – stochastický model | ||
5 | Jazykové modely hodnocení | Zmatek | ||
5 | Naivní Bayes klasifikátor | Pravděpodobnostní klasifikátory | Příprava laboratorního excercise |
Potvrzení
Program Human-Centered AI Masters byl spolufinancován Nástrojem Evropské unie pro propojení Evropy v rámci grantu CEF-TC-2020–1 Digitální dovednosti 2020-EU-IA-0068.