Administrativ information
Titel | Naturlig språkbehandling |
Varaktighet | 60–70 minuter |
Modul | A |
Typ av lektion | Föreläsning |
Fokus | Praktiskt – AI-modellering |
Ämne | Statistiska metoder för NLP- och textklassificering |
Nyckelord
NLP,Natuell språkbehandling,Beräkningslingvistik,
Lärandemål
- Eleverna förstår de grundläggande begreppen Natural Language Processing
- Eleverna lär sig NLP-användningsfall
- Eleverna bekanta sig med olika NLP verktyg och koncept
Förväntad förberedelse
Lärande händelser som ska slutföras innan
Ingen.
Obligatoriskt för studenter
- En genomgång av grundläggande statistik
Valfritt för studenter
- Betyg för Python Programming Language
Referenser och bakgrund för studenter
- Etiskt genom design: Etik Bästa praxis för naturlig språkbehandling
- Biskop, Christopher M. (2006). Mönsterigenkänning och maskininlärning
- [https://terpconnect.umd.edu/~kshilton/pdf/VitaketalCSCWpreprint.pdf Beyond the Belmont Principles: Etiska utmaningar, praktiker och övertygelser i Online Data Research Community]
- Jurafskly D., Martin J. H. – En introduktion till NLP, Computational Linguistics och Speech Recognition
- Christopher D. Manning, Prabhakar Raghavan och Hinrich Schütze, Introduktion till Information Retrieval, Cambridge University Press. 2008.
Rekommenderas för lärare
Lektionsmaterial
Instruktioner för lärare
Du kan basera den här klassen runt diabilderna. Materialet föreslås men kan anpassas.
Konturer
Varaktighet (min) | Beskrivning | Begrepp | Verksamhet | Material |
---|---|---|---|---|
5 | Introduktion till Natural Language Processing, mål, metoder och utmaningar | datalingvistik, naturlig språkbehandling | ||
5 | Bearbetning av naturligt språk Text: Användningsfall | korpus, segmentering, tokenisering, konkordans | ||
10 | Vanliga uttryck, textnormalisering | språkmodellering, redigera avstånd | ||
15 | N-gram modeller | Sekvenser av ord som en Markov-process | ||
5 | Kedjeregel för probalitet | Allmän produktregel | ||
10 | Markov och MAximum Likelihood Estimation | Markov kedja – stokastisk modell | ||
5 | Språkmodeller för utvärdering | Perplexitet | ||
5 | Naiva Bayes Classifier | Probabilistiska klassificerare | Förbereda labbövningen |
Erkännanden
Masterprogrammet Human-Centered AI har samfinansierats av Fonden för ett sammanlänkat Europa i Europeiska unionen inom ramen för Grant CEF-TC-2020–1 Digital Skills 2020 EU-IA-0068.