Adminisztratív információk
Cím | Természetes nyelvfeldolgozás |
Időtartam | 60–70 perc |
Modul | A |
Lecke típusa | Előadás |
Fókusz | Praktikus – AI modellezés |
Téma | Az NLP és a szöveg osztályozásának statisztikai módszerei |
Kulcsszó
NLP,Természetes nyelvfeldolgozás, Számítógépes nyelvészet,
Tanulási célok
- A diákok megértik a természetes nyelv feldolgozásának alapfogalmait
- A diákok megtanulják az NLP használati eseteket
- A diákok megismerkednek a különböző NLP eszközökkel és koncepciókkal
Várható előkészítés
Az előtt befejezendő tanulási események
Egy sem.
Kötelező a diákok számára
- Az alapstatisztikák áttekintése
Választható diákok számára
- Python programozási nyelv
Referenciák és háttér a diákok számára
- Etikus formatervezés: Etikai bevált gyakorlatok a természetes nyelv feldolgozásához
- Püspök, Christopher M. (2006). Mintafelismerés és gépi tanulás
- [https://terpconnect.umd.edu/~kshilton/pdf/VitaketalCSCWpreprint.pdf Beyond the Belmont Principles: Etikai kihívások, gyakorlatok és hitek az online adatkutató közösségben]
- Jurafskly D., Martin J. H. – Bevezetés az NLP-be, a számítástechnikai nyelvészetbe és a beszédfelismerésbe
- Christopher D. Manning, Prabhakar Raghavan és Hinrich Schütze, Bevezetés az információgyűjtésbe, Cambridge University Press. 2008.
Leckeanyagok
Utasítások tanároknak
Ezt az osztályt a diák köré alapozhatja. Az anyag javasolt, de adaptálható.
Vázlat
Időtartam (min) | Leírás | Fogalmak | Tevékenység | Anyag |
---|---|---|---|---|
5 | Bevezetés a természetes nyelvfeldolgozásba, célok, módszerek és kihívások | számítógépes nyelvészet, természetes nyelvfeldolgozás | ||
5 | Feldolgozás Természetes Nyelv Szöveg: Használati esetek | korpusz, szegmentáció, tokenizáció, egyezés | ||
10 | Reguláris kifejezések, szöveg Normalizálás | nyelvi modellezés, távolság szerkesztése | ||
15 | N-gramm modellek | Szavak szekvenciái Markov-folyamatként | ||
5 | A Probalitás láncszabálya | Általános termékszabály | ||
10 | Markov és MAximum valószínűségi becslés | Markov lánc – sztochasztikus modell | ||
5 | Értékelési nyelvi modellek | Zavartság | ||
5 | Naiv Bayes osztályozó | Valószínűségi osztályozók | A laboratóriumi excercise előkészítése |
Visszaigazolások
A Human-Centered AI Masters programot az Európai Unió Európai Hálózatfinanszírozási Eszköze (CEF-TC-2020–1 Digitális készségek 2020 EU-IA-0068) társfinanszírozta.