Administrativní informace
Název | Příprava a průzkum dat |
Trvání | 60 |
Modul | A |
Typ lekce | Přednáška |
Soustředění | Praktické – modelování umělé inteligence |
Téma | Metody přípravy dat |
Klíčová slova
Příprava dat, Čištění dat, Transformace dat, Normalizace dat, Integrace dat, Snížení dat,
Vzdělávací cíle
- Aby bylo možné zvolit nejvhodnější metodu přípravy dat na základě případu
- příprava dat v praxi (zpracovat chybějící hodnoty, vytvořit nové odvozené funkce)
- Obohacení dat
- Etické: anonymizace a problémy s tím (identifikace je možná nepřímým způsobem) – opět by tam mělo být několik příkladů
- Imputace – zmínit, že může zavádět zkreslení a že to je třeba mít na paměti
- Tvorba nových funkcí – ztráta správné sémantiky
- Etické: odstranění zkreslení z datové sady
- Paralely a rozdíly mezi vzorkováním dat ve statistice a získáváním dat (včetně dat velkého objemu) pro ML a UI
Očekávaná příprava
Vzdělávací akce, které mají být dokončeny před
Povinné pro studenty
- N/A
Volitelné pro studenty
- N/A
Reference a zázemí pro studenty
- N/A
Doporučeno pro učitele
Materiály pro výuku
Pokyny pro učitele
Tuto třídu můžete založit kolem skluzavek.
Obrys
Doba trvání (min) | Popis | Koncepty | |
---|---|---|---|
5 | Obrys | Metody přípravy údajů: o co jde? | |
5 | Problémy/předzpracování | Jaké problémy mohou mít data, čištění, čištění | |
5 | Příprava údajů | Čištění, transformace, integrace, normalizace, imputace, identifikace hluku | |
5 | Detailní příprava dat | Formy přípravy dat | |
10 | Data Čištění detailně | Oprava nebo odstranění nesprávných, poškozených, nesprávně formátovaných, duplicitních nebo neúplných dat v datové sadě | |
10 | Data Transformace detailně | Převod dat z jednoho formátu do druhého, osvědčené postupy. | |
5 | Detailní normalizace dat | Osvědčené postupy normalizace údajů. | |
5 | Integrace dat v detailu | Osvědčené postupy integrace dat. | |
5 | Detailní redukce dat | Osvědčené postupy pro snižování údajů. | |
10 | Příprava dat v praxi | Filtrování, chybějící hodnoty, duplikáty, | |
5 | Závěrečné poznámky | Důraz je kladen na důležitost přípravy dat. |
Potvrzení
Program Human-Centered AI Masters byl spolufinancován Nástrojem Evropské unie pro propojení Evropy v rámci grantu CEF-TC-2020–1 Digitální dovednosti 2020-EU-IA-0068.