Verwaltungsinformationen
Titel | Verarbeitung natürlicher Sprache |
Dauer | 60 – 70 Minuten |
Modulen | A |
Unterrichtstyp | Vortrag |
Fokussierung | Praktisch – KI-Modellierung |
Themenbereich | Statistische Methoden für NLP und Textklassifizierung |
Suchbegriffe
NLP,Natual Language Processing, Computational Linguistics,
Lernziele
- Die Schüler verstehen die grundlegenden Konzepte der natürlichen Sprachverarbeitung
- Schüler lernen NLP-Anwendungsfälle kennen
- Die Studierenden lernen verschiedene NLP-Tools und -Konzepte kennen
Erwartete Vorbereitung
Lernveranstaltungen, die vorab abgeschlossen werden müssen
Keine.
Obligatorisch für Studenten
- Eine Überprüfung der Basisstatistiken
Optional für Studenten
- Überprüfung der Python-Programmiersprache
Referenzen und Hintergründe für Studierende
- Ethisch nach Design: Ethische Best Practices für die Verarbeitung natürlicher Sprache
- Bischof, Christopher M. (2006). Mustererkennung und maschinelles Lernen
- [https://terpconnect.umd.edu/~kshilton/pdf/VitaketalCSCWpreprint.pdf Jenseits der Belmont-Prinzipien: Ethische Herausforderungen, Praktiken und Überzeugungen in der Online Data Research Community
- Jurafskly D., Martin J. H. – Eine Einführung in NLP, Computational Linguistics, and Speech Recognition
- Christopher D. Manning, Prabhakar Raghavan und Hinrich Schütze, Einführung in die Informationsgewinnung, Cambridge University Press. 2008.
Unterrichtsmaterialien
Anleitung für Lehrer
Sie können diese Klasse um die Folien herum stützen. Das Material wird vorgeschlagen, kann aber angepasst werden.
Gliederung
Dauer (Min.) | Beschreibung | Konzepte | Aktivität | Werkstoffe |
---|---|---|---|---|
5 | Einführung in die Verarbeitung natürlicher Sprache, Ziele, Methoden und Herausforderungen | Computerlinguistik, Verarbeitung natürlicher Sprache | ||
5 | Verarbeitung natürlicher Sprachtexte: Anwendungsfälle | Korpus, Segmentierung, Tokenisierung, Konkordanz | ||
10 | Reguläre Ausdrücke, Textnormalisierung | Sprachmodellierung, Bearbeitungsabstand | ||
15 | N-Gramm-Modelle | Sequenzen von Wörtern als Markov-Prozess | ||
5 | Kettenregel der Probalität | Allgemeine Produktregel | ||
10 | Markov und MAximum Likelihood Estimation | Markov Kette – stochastisches Modell | ||
5 | Bewertungs-Sprachmodelle | Verwirrtheit | ||
5 | Naive Bayes Klassifikator | Probabilistische Klassifikatoren | Vorbereitung des Laborauszugs |
Danksagung
Das Human-Centered AI Masters-Programm wurde von der Fazilität „Connecting Europe“ der Europäischen Union im Rahmen des Zuschusses „CEF-TC-2020-1 Digital Skills 2020-EU-IA-0068“ kofinanziert.