Informații administrative
Titlu | Prelucrarea limbajului natural |
Durată | 60-70 minute |
Modulul | A |
Tipul lecției | Prelegere |
Focalizare | Practică – Modelarea IA |
Subiect | Metode statistice pentru NLP și clasificarea textului |
Cuvinte cheie
NLP, Prelucrarea limbajului matern, Lingvistică computațională,
Obiective de învățare
- Elevii înțeleg conceptele de bază ale procesării limbajului natural
- Elevii învață cazuri de utilizare NLP
- Elevii se familiarizează cu diverse instrumente și concepte NLP
Pregătirea preconizată
Evenimente de învățare care urmează să fie finalizate înainte
Nici unul.
Obligatoriu pentru studenți
- O revizuire a statisticilor de bază
Opțional pentru studenți
- Analiza limbajului de programare Python
Referințe și context pentru studenți
- Etică prin design: Cele mai bune practici de etică pentru procesarea limbajului natural
- Bishop, Christopher M. (2006). Recunoașterea modelelor și învățarea automată
- [https://terpconnect.umd.edu/~kshilton/pdf/VitaketalCSCWpreprint.pdf Dincolo de principiile Belmont: Provocări etice, practici și credințe în comunitatea de cercetare a datelor online]
- Jurafskly D., Martin J. H. – Introducere în NLP, Lingvistică Computațională și Recunoașterea vorbirii
- Christopher D. Manning, Prabhakar Raghavan și Hinrich Schütze, Introducere în recuperarea informațiilor, Cambridge University Press. 2008.
Recomandat pentru profesori
Materiale de lecție
Instrucțiuni pentru profesori
Puteți baza această clasă în jurul diapozitivelor. Materialul este sugerat, dar poate fi adaptat.
Contur
Durată (min) | Descriere | Concepte | Activitate | Material |
---|---|---|---|---|
5 | Introducere în procesarea limbajului natural, obiective, metode și provocări | lingvistică informatică, prelucrarea limbajului natural | ||
5 | Prelucrarea textului limbajului natural: Cazuri de utilizare | corpus, segmentare, tokenizare, concordanță | ||
10 | Expresii regulate, normalizarea textului | modelarea limbii, editarea distanței | ||
15 | N-gram Modele | Secvențe de cuvinte ca proces Markov | ||
5 | Regula lanțului de probalitate | Regula generală a produsului | ||
10 | Markov și estimarea probabilității maxime | Lanț Markov – model stochastic | ||
5 | Modele lingvistice de evaluare | Perplexitate | ||
5 | Naive Bayes Clasificator | Clasificatori probabilistici | Pregătirea exercitiului de laborator |
Confirmări
Programul de masterat AI centrat pe om a fost cofinantat de Mecanismul pentru interconectarea Europei al Uniunii Europene sub Grantul CEF-TC-2020-1 Digital Skills 2020-EU-IA-0068.