Административна информация
Дял | Обработка на естествен език |
Продължителност | 60—70 минути |
Модул | А |
Вид на урока | Лекция |
Фокус | Практическо — моделиране на ИИ |
Тема | Статистически методи за НЛП и класификация на текста |
Ключови думи
НЛП, Обработка на естествен език, Компютърна лингвистика,
Учебни цели
- Учениците разбират основните понятия за обработка на естествен език
- Учениците научават случаи на използване на НЛП
- Студентите се запознават с различни НЛП инструменти и концепции
Очаквана подготовка
Обучение на събития, които трябва да бъдат завършени преди
Няма.
Задължително за студентите
- Преглед на основните статистически данни
Незадължително за студенти
- Език за програмиране на Python
Референции и фон за студенти
- Етично по дизайн: Етични най-добри практики за обработка на естествен език
- Бишъп, Кристофър М. (2006). Разпознаване на модели и машинно обучение
- [https://terpconnect.umd.edu/~kshilton/pdf/VitaketalCSCWpreprint.pdf Отвъд принципите на Белмонт: Етични предизвикателства, практики и вярвания в общността за онлайн изследвания на данни]
- Jurafskly D., Martin J. H. — Въведение в НЛП, компютърна лингвистика и разпознаване на речта
- Кристофър Манинг, Прабхакар Рагаван и Хинрих Шутце, Въведение в извличането на информация, Cambridge University Press. 2008.
Препоръчва се за учители
Материали за уроци
Инструкции за учители
Можете да базирате този клас около слайдовете. Материалът е предложен, но може да бъде адаптиран.
Очертаване
Продължителност (минимум) | Описание | Концепции | Дейност | Материал |
---|---|---|---|---|
5 | Въведение в обработката на естествен език, цели, методи и предизвикателства | компютърна лингвистика, обработка на естествен език | ||
5 | Обработка на естествен език Текст: Случаи на употреба | корпус, сегментиране, токенизация, съгласуване | ||
10 | Регулярни изрази, текстово нормализиране | езиково моделиране, редактиране на разстояние | ||
15 | N-грам модели | Последователност от думи като Марков процес | ||
5 | Верижно правило на склонността | Общо правило за продукта | ||
10 | Марков и MAximum Вероятност Оценяване | Маркова верига — стохастичен модел | ||
5 | Езикови модели за оценка | Обърканост | ||
5 | Наивни Бейс Класификатор | Вероятностни класификатори | Подготовка на лабораторното упражнение |
Потвърждения
Магистърската програма по ИИ, насочена към човека, беше съфинансирана от Механизма за свързване на Европа на Европейския съюз под формата на безвъзмездни средства № CEF-TC-2020—1 Digital Skills 2020-EU-IA-0068.