Hallinnolliset tiedot
Otsikko | Luonnollinen kielenkäsittely |
Kesto | 60–70 min |
Moduuli | A |
Oppitunnin tyyppi | Käytännöllinen |
Keskittyminen | Käytännöllinen – AI Modelling |
Aihe | Tekstiluokitus, Sentiment-luokitus |
Avainsanoja
Luonnollinen kielenkäsittely, Naive Bayes -luokitus,
Oppimistavoitteet
- Opiskelija ymmärtää perusasiat ydin NLP tekniikoita
- Opiskelija tutustuu Naive Bayes -luokituksen käyttöön
Odotettu valmistelu
Oppimistapahtumat valmistuvat ennen
Ei mitään.
Pakollinen opiskelijoille
- Perus Python-ohjelmointi
- Perustilastot
Valinnainen opiskelijoille
Referenssejä ja taustaa opiskelijoille
- Luonnollinen kieli työkalupakki
- Christopher D. Manning, Prabhakar Raghavan ja Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press. 2008
- Jurafskly D., Martin J. H. – Johdanto NLP: lle, Computational Linguistics, and Speech Recognition
Suositellaan opettajille
- Luonnollinen kieli työkalupakki
- Christopher D. Manning, Prabhakar Raghavan ja Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press. 2008
- Jurafskly D., Martin J. H. – Johdanto NLP: lle, Computational Linguistics, and Speech Recognition
Oppituntimateriaalit
Ohjeita opettajille
Tämä oppimistapahtuma koostuu laboratoriotehtävistä, jotka opiskelijoiden on ratkaistava johtavan ohjaajan avulla.
Hahmotella
Kesto (Min) | Kuvaus | Käsitteet | Aktiivisuus | Materiaali |
---|---|---|---|---|
5 | Sanatokenisointi | |||
5–10 | Pandas DataFrames | |||
10 | Sanasäkki | |||
10 | Tokenisointi säännöllisellä ilmauksella | |||
10 | N-gramman mallit | |||
5 | Pysäytyssanat | |||
10–15 | Normalisointi, Stemming ja Lemmatisaatio | |||
5–10 | Tunteiden analysointi |
Tunnustukset
Human-Centered AI Masters -ohjelmaa rahoitettiin Euroopan unionin Verkkojen Eurooppa -välineestä (CEF-TC-2020–1 Digital Skills 2020-EU-IA-0068).