Administrativní informace
Název | Zpracování přirozeného jazyka |
Trvání | 60–70 minut |
Modul | A |
Typ lekce | Praktické |
Soustředění | Praktické – modelování umělé inteligence |
Téma | Text Klasifikace, Sentiment Klasifikace |
Klíčová slova
Přirozené zpracování jazyka, Naivní Bayes klasifikátor,
Vzdělávací cíle
- Student pochopí základy základních NLP technik
- Student se seznámí s použitím klasifikátoru Naive Bayes
Očekávaná příprava
Vzdělávací akce, které mají být dokončeny před
Žádné.
Povinné pro studenty
- Základní programování Pythonu
- Základní statistiky
Volitelné pro studenty
Reference a zázemí pro studenty
- Sada nástrojů pro přirozený jazyk
- Manning, Prabhakar Raghavan a Hinrich Schütze, Úvod do vyhledávání informací, Cambridge University Press. 2008
- Jurafskly D., Martin J. H. – Úvod do NLP, výpočetní lingvistika a rozpoznávání řeči
Doporučeno pro učitele
- Sada nástrojů pro přirozený jazyk
- Manning, Prabhakar Raghavan a Hinrich Schütze, Úvod do vyhledávání informací, Cambridge University Press. 2008
- Jurafskly D., Martin J. H. – Úvod do NLP, výpočetní lingvistika a rozpoznávání řeči
Materiály pro výuku
Pokyny pro učitele
Tato vzdělávací akce se skládá z laboratorních úkolů, které budou řešeny studenty s pomocí vedoucího instruktora.
Obrys
Doba trvání (Min) | Popis | Koncepty | Aktivity | Materiál |
---|---|---|---|---|
5 | Tokenizace slov | |||
5–10 | Pandy DataFrames | |||
10 | Pytel slov | |||
10 | Tokenizace s pravidelným výrazem | |||
10 | N-gramové modely | |||
5 | Stopwords | |||
10–15 | Normalizace, stimulace a lemmatizace | |||
5–10 | Analýza sentimentu |
Potvrzení
Program Human-Centered AI Masters byl spolufinancován Nástrojem Evropské unie pro propojení Evropy v rámci grantu CEF-TC-2020–1 Digitální dovednosti 2020-EU-IA-0068.