Administrativne informacije
Naslov | Obrada prirodnog jezika |
Trajanje | 60 – 70 minuta |
Modul | A |
Vrsta lekcija | Predavanje |
Fokus | Praktično – modeliranje umjetne inteligencije |
Tema | Statističke metode za NLP i razvrstavanje teksta |
Ključne riječi
NLP, obrada internetskog jezika, računalna lingvistika,
Ciljevi učenja
- Učenici razumiju osnovne koncepte obrade prirodnog jezika
- Učenici uče slučajeve korištenja NLP-a
- Studenti se upoznaju s različitim NLP alatima i konceptima
Očekivana priprema
Edukativni događaji koji će biti završeni prije
Nijedan.
Obvezno za studente
- Pregled osnovnih statističkih podataka
Neobvezno za studente
- Pregled Python programskog jezika
Preporuke i pozadina za studente
- Etika prema dizajnu: Etika najbolje prakse za obradu prirodnog jezika
- Bishop, Christopher M. (2006.). Prepoznavanje uzoraka i strojno učenje
- [https://terpconnect.umd.edu/~kshilton/pdf/VitaketalCSCWpreprint.pdf Beyond the Belmont Principles: Etički izazovi, prakse i uvjerenja u zajednici za istraživanje podataka na internetu]
- Jurafskly D., Martin J. H. – Uvod u NLP, računalnu lingvistiku i prepoznavanje govora
- Christopher D. Manning, Prabhakar Raghavan i Hinrich Schütze, Uvod u dohvaćanje informacija, Cambridge University Press. 2008.
Preporučeno nastavnicima
Nastavni materijali
Upute za učitelje
Možete bazirati ovaj razred oko slajdova. Materijal se predlaže, ali se može prilagoditi.
Nacrt
Trajanje (min) | Opis | Koncepti | Aktivnost | Materijal |
---|---|---|---|---|
5 | Uvod u obradu prirodnog jezika, ciljeve, metode i izazove | računalna lingvistika, obrada prirodnog jezika | ||
5 | Obrada prirodnog jezika, tekst: Slučajevi uporabe | korpus, segmentacija, tokenizacija, usklađenost | ||
10 | Redovito izražavanje, normalizacija teksta | jezično modeliranje, uređivanje udaljenosti | ||
15 | N-gram modeli | Slijed riječi kao Markov proces | ||
5 | Lančana vladavina vjerojatnosti | Opće pravilo o proizvodu | ||
10 | Markov i MAximum procjena vjerojatnosti | Markov lanac – stohastički model | ||
5 | Modeli za ocjenjivanje jezika | Zbunjenost | ||
5 | Naivni Bayes klasifikator | Probabilistički klasifikatori | Priprema laboratorijske vježbe |
Priznanja
Diplomski studij umjetne inteligencije usmjeren na čovjeka sufinanciran je Instrumentom za povezivanje Europe Europske unije u okviru bespovratnih sredstava CEF-TC-2020 – 1 Digital Skills 2020-EU-IA-0068.