Upravne informacije
Naslov | Obdelava naravnega jezika |
Trajanje | 60–70 minut |
Modul | A |
Vrsta lekcije | Predavanje |
Osredotočenost | Praktično – modeliranje umetne inteligence |
Tema | Statistične metode za NLP in klasifikacijo besedila |
Ključne besede
NLP, Obdelava naravnega jezika, Računalniška jezikoslovje,
Učni cilji
- Učenci razumejo osnovne koncepte obdelave naravnega jezika
- Učenci se naučijo primerov uporabe NLP
- Učenci se seznanijo z različnimi NLP orodji in koncepti
Pričakovana priprava
Učenje Dogodki, ki jih je treba dokončati pred
Nobenega.
Obvezno za študente
- Pregled osnovnih statističnih podatkov
Neobvezno za študente
- Izvirnik: Python Programming Language
Reference in ozadje za študente
- Etična po dizajnu: Etika Najboljše prakse za obdelavo naravnega jezika
- Škof, Christopher M. (2006). Prepoznavanje vzorcev in strojno učenje
- [https://terpconnect.umd.edu/~kshilton/pdf/VitaketalCSCWpreprint.pdf Poleg načel iz Belmonta: Etični izzivi, prakse in prepričanja v skupnosti za spletno raziskovanje podatkov]
- Jurafskly D., Martin J. H. – Uvod v NLP, računalniško jezikoslovje in prepoznavanje govora
- Christopher D. Manning, Prabhakar Raghavan in Hinrich Schütze, Uvod v pridobivanje informacij, Cambridge University Press. 2008.
Priporočeno za učitelje
Gradivo za učne ure
Navodila za učitelje
Ta razred lahko utemeljite okoli diapozitivov. Material je predlagan, vendar ga je mogoče prilagoditi.
Obris
Trajanje (mini) | Opis | Koncepti | Aktivnost | Material |
---|---|---|---|---|
5 | Uvod v obdelavo naravnega jezika, cilje, metode in izzive | računalniško jezikoslovje, obdelava naravnega jezika | ||
5 | Obdelava naravnega jezika Besedilo: Primeri uporabe | korpus, segmentacija, tokenizacija, skladnost | ||
10 | Redno izražanje, normalizacija besedila | jezikovno modeliranje, urejanje razdalje | ||
15 | N-gramski modeli | Zaporedja besed kot Markov proces | ||
5 | Verižno pravilo verjetnosti | Splošno pravilo izdelka | ||
10 | Ocena verjetnosti Markov in MAximum | Markov veriga – stohastični model | ||
5 | Jezikovni modeli za ocenjevanje | Zmedenost | ||
5 | Naive Bayes klasifikator | Verjetnostni klasifikatorji | Priprava laboratorijske vaje |
Priznanja
Program Masters umetne inteligence, ki je bil vključen v človeka, je bil sofinanciran z instrumentom za povezovanje Evrope Evropske unije v okviru nepovratnih sredstev (CEF-TC-2020–1 Digital Skills 2020-EU-IA-0068).