Hallinnolliset tiedot
Otsikko | Luonnollinen kielenkäsittely |
Kesto | 60–70 minuuttia |
Moduuli | A |
Oppitunnin tyyppi | Luento |
Keskittyminen | Käytännöllinen – AI Modelling |
Aihe | NLP:n ja tekstiluokituksen tilastolliset menetelmät |
Avainsanoja
NLP,Natual Language Processing, Computational Linguistics,
Oppimistavoitteet
- Opiskelija ymmärtää luonnollisen kielenkäsittelyn peruskäsitteet
- Opiskelijat oppivat NLP: n käyttötapaukset
- Opiskelijat tutustuvat erilaisiin NLP-työkaluihin ja -konsepteihin
Odotettu valmistelu
Oppimistapahtumat valmistuvat ennen
Ei mitään.
Pakollinen opiskelijoille
- Perustilastojen tarkastelu
Valinnainen opiskelijoille
- Python-ohjelmointikieli
Referenssejä ja taustaa opiskelijoille
- Eettinen suunnittelu: Etiikka Parhaat käytännöt luonnolliseen kielenkäsittelyyn
- Piispa, Christopher M. (2006). Kuvioiden tunnistaminen ja koneoppiminen
- [https://terpconnect.umd.edu/~kshilton/pdf/VitaketalCSCWpreprint.pdf Belmontin periaatteiden jälkeen: Eettiset haasteet, käytännöt ja uskomukset online-datatutkimusyhteisössä]
- Jurafskly D., Martin J. H. – Johdanto NLP: lle, Computational Linguistics, and Speech Recognition
- Christopher D. Manning, Prabhakar Raghavan ja Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press. 2008.
Suositellaan opettajille
Oppituntimateriaalit
Ohjeita opettajille
Voit perustaa tämän luokan diojen ympärille. Aineistoa ehdotetaan, mutta sitä voidaan mukauttaa.
Hahmotella
Kesto (Min) | Kuvaus | Käsitteet | Aktiivisuus | Materiaali |
---|---|---|---|---|
5 | Johdanto luonnolliseen kielenkäsittelyyn, tavoitteet, menetelmät ja haasteet | tietokonelingvistiikka, luonnollisen kielen käsittely | ||
5 | Luonnollisen kielen tekstin käsittely: Käyttötapaukset | korpus, segmentointi, tokenisointi, koncordanssi | ||
10 | Säännölliset ilmaisut, tekstin normalisointi | kielen mallinnus, muokkaa etäisyyttä | ||
15 | N-gramman mallit | Sanasekvenssit Markovin prosessina | ||
5 | Ketjun Probality sääntö | Yleinen tuotesääntö | ||
10 | Markov ja MAximum Todennäköisyyden arviointi | Markov ketju – stokastinen malli | ||
5 | Arviointikielimallit | Hämmennys | ||
5 | Naiivi Bayes -luokitus | Todennäköisyydet luokittelijat | Labraharjoituksen valmistelu |
Tunnustukset
Human-Centered AI Masters -ohjelmaa rahoitettiin Euroopan unionin Verkkojen Eurooppa -välineestä (CEF-TC-2020–1 Digital Skills 2020-EU-IA-0068).