Hallinnolliset tiedot
Otsikko | Tietojen valmistelu ja tutkiminen |
Kesto | 60 |
Moduuli | A |
Oppitunnin tyyppi | Luento |
Keskittyminen | Käytännöllinen – AI Modelling |
Aihe | Tietojen valmistelumenetelmät |
Avainsanoja
Tietojen valmistelu, Tietojen puhdistus, Tietojen muuntaminen, Data Normalization,Data Integration, Tietojenvähentäminen,
Oppimistavoitteet
- Pystymme valitsemaan tapauksen perusteella sopivimman tietojen valmistelumenetelmän
- tietojen valmistelu käytännössä (käsittele puuttuvat arvot, luo uusia johdettuja ominaisuuksia)
- Tietojen rikastaminen
- Eettinen: anonymisointi ja tähän liittyvät ongelmat (tunnistaminen on mahdollista epäsuoralla tavalla) – jälleen kerran, siellä pitäisi olla joitakin esimerkkejä.
- Imputointi – mainitse, että se voi aiheuttaa puolueellisuutta ja että tämä on pidettävä mielessä
- Uuden ominaisuuden luominen – oikean semantiikan menetys
- Eettinen: Poista vääristymät tietoaineistosta
- Yhtäläisyydet ja erot tilastotietojen otannan ja datan hankinnan (myös massadatan) välillä ML:n ja tekoälyn osalta
Odotettu valmistelu
Oppimistapahtumat valmistuvat ennen
Pakollinen opiskelijoille
- EI
Valinnainen opiskelijoille
- EI
Referenssejä ja taustaa opiskelijoille
- EI
Suositellaan opettajille
Oppituntimateriaalit
Ohjeita opettajille
Voit perustaa tämän luokan diojen ympärille.
Hahmotella
Kesto (min) | Kuvaus | Käsitteet | |
---|---|---|---|
5 | Hahmotella | Tietojen valmistelumenetelmät: mitä järkeä on? | |
5 | Ongelmat/esikäsittely | Mitä ongelmia datalla voi olla, puhdistus, puhdistus | |
5 | Tietojen valmistelu | Puhdistus, muunnos, integrointi, normalisointi, imputointi, melun tunnistaminen | |
5 | Tietojen valmistelu yksityiskohtaisesti | Tietojen valmistelun muodot | |
10 | Tietojen puhdistus yksityiskohtaisesti | Virheellisten, vioittuneiden, virheellisesti muotoiltujen, kaksoiskappaleiden tai epätäydellisten tietojen korjaaminen tai poistaminen tietoaineistossa | |
10 | Tietojen muuntaminen yksityiskohtaisesti | Tietojen muuntaminen muodosta toiseen, parhaat käytännöt. | |
5 | Tietojen normalisointi yksityiskohtaisesti | Tietojen normalisointia koskevat parhaat käytännöt. | |
5 | Tietojen integrointi yksityiskohtaisesti | Tietojen integroinnin parhaat käytännöt. | |
5 | Tietojen pienentäminen yksityiskohtaisesti | Tietojen vähentämisen parhaat käytännöt. | |
10 | Tietojen valmistelu käytännössä | Suodatus, puuttuvat arvot, kaksoiskappaleet, | |
5 | Loppuhuomautukset | Painotetaan tietojen valmistelun merkitystä. |
Tunnustukset
Human-Centered AI Masters -ohjelmaa rahoitettiin Euroopan unionin Verkkojen Eurooppa -välineestä (CEF-TC-2020–1 Digital Skills 2020-EU-IA-0068).