Административна информация
Дял | Изготвяне и проучване на данни |
Продължителност | 60 |
Модул | А |
Вид на урока | Лекция |
Фокус | Практическо — моделиране на ИИ |
Тема | Методи за изготвяне на данни |
Ключови думи
Подготовка на данни, почистване на данни, преобразуване на данни, нормализиране на данните, интегриране на данни, намаляване на данните,
Учебни цели
- За да може да избере най-подходящия метод за изготвяне на данни въз основа на случая
- подготвяне на данни на практика (справяне с липсващите стойности, създаване на нови производни характеристики)
- Обогатяване на данни
- Етични: анонимизиране и проблеми с това (идентификацията е възможна по индиректен начин) — отново трябва да има някои примери там
- Уговорка — да се спомене, че тя може да въведе пристрастия и че това трябва да се има предвид
- Създаване на нови функции — загуба на подходяща семантика
- Етични: премахване на предубежденията от набора от данни
- Паралели и разлики между вземането на проби от данни в статистиката и придобиването на данни (включително големи информационни масиви) за ML и ИИ
Очаквана подготовка
Обучение на събития, които трябва да бъдат завършени преди
Задължително за студентите
- НЕ Е ПРИЛОЖИМО
Незадължително за студенти
- НЕ Е ПРИЛОЖИМО
Референции и фон за студенти
- НЕ Е ПРИЛОЖИМО
Препоръчва се за учители
Материали за уроци
Инструкции за учители
Можете да базирате този клас около слайдовете.
Очертаване
Продължителност (мин) | Описание | Концепции | |
---|---|---|---|
5 | Очертаване | Методи за подготовка на данните: какъв е смисълът? | |
5 | Проблеми/Предварителна обработка | Какви проблеми могат да имат данните, почистване, пречистване | |
5 | Изготвяне на данни | Почистване, преобразуване, интегриране, нормализиране, импутация, идентификация на шума | |
5 | Изготвяне на данни в детайли | Форми на подготовка на данни | |
10 | Почистване на данни в детайли | Фиксиране или премахване на неточни, повредени, неправилно форматирани, дублирани или непълни данни в набор от данни | |
10 | Преобразуване на данни в детайли | Конвертиране на данни от един формат в друг, най-добри практики. | |
5 | Нормализация на данните в детайли | Най-добри практики за нормализиране на данните. | |
5 | Интегриране на данни в детайли | Най-добри практики за интегриране на данни. | |
5 | Намаляване на данните в детайли | Най-добри практики за намаляване на данните. | |
10 | Изготвяне на данни на практика | Филтриране, липсващи стойности, дубликати, | |
5 | Заключителни бележки | Подчертаване на значението на подготовката на данните. |
Потвърждения
Магистърската програма по ИИ, насочена към човека, беше съфинансирана от Механизма за свързване на Европа на Европейския съюз под формата на безвъзмездни средства № CEF-TC-2020—1 Digital Skills 2020-EU-IA-0068.