Hallinnolliset tiedot
Otsikko | Johdatus tietosuojaan |
Kesto | 135 min |
Moduuli | B |
Oppitunnin tyyppi | Luento |
Keskittyminen | Eettinen – luotettava tekoäly |
Aihe | Tietojen yksityisyys |
Avainsanoja
Tietosuoja, Yksityisyysriski, Henkilötiedot, Herkät tiedot, Profilointi, Seuranta, Anonymisointi, Yksityisyys koneoppimisessa, TOR, Pseudonymization, Suorat ja epäsuorat tunnisteet,
Oppimistavoitteet
- Hanki yleinen käsitys yksityisyyden käsitteestä.
- Ymmärrä tietosuoja-analyysin ja henkilötietojen tunnistamisen vaikeudet ja sudenkuopat.
- Ymmärrä anonymisoinnin ja datan hyödyllisyyden välinen kompromissi (ei ilmaista lounasta).
- Ymmärrä tietoturvan ja tietosuojan välinen ero.
- Opi anonyymin viestinnän ja TORin perusperiaatteet.
- Tunnistaa, tutkia ja keskustella tekoälyn ja koneoppimisen mallien keskeisistä riskeistä
Odotettu valmistelu
Oppimistapahtumat valmistuvat ennen
Pakollinen opiskelijoille
- Lineaarinen perusalgebra,
- Koneen perusoppiminen
Valinnainen opiskelijoille
Ei mitään.
Referenssejä ja taustaa opiskelijoille
Suositellaan opettajille
Oppituntimateriaalit
Ohjeita opettajille
Tämä luento tarjoaa yleiskuvan tietosuojasta. Se keskittyy erilaisiin tietosuojaongelmiin verkkoseurannassa, tietojen jakamisessa ja koneoppimisessa sekä joihinkin lieventämistekniikoihin. Tavoitteena on antaa olennaiset (tekniset) taustatiedot, joita tarvitaan henkilötietojen tunnistamiseen ja suojaamiseen. Kurssi valaisee, miksi sosiaalisesti tai yksilöllisesti hyödyllisen tiedon hankkiminen ihmisistä on haastavaa paljastamatta henkilökohtaisia tietoja. Näistä taidoista on tulossa jokaisen henkilökohtaisia ja arkaluonteisia tietoja käsittelevien tieto- ja ohjelmistoinsinöörien ja tietosuojavastaavan velvollisuus, ja niitä edellytetään myös Euroopan tietosuoja-asetuksessa (GDPR).
Hahmotella
Kesto (min) | Kuvaus | Käsitteet |
---|---|---|
20 | Mikä on yksityisyys? | Yksityisyys on perusoikeus. Historia tai yksityisyys. Yksityisyyden tärkeys. Tietovuodon havainnollistaminen; kuinka paljon ihmiset jakavat itsestään suoraan tai välillisesti? Miksi yksityisyys on ongelma? Lainsäädännön ja teknisten ratkaisujen merkitys (PETS). |
15 | Henkilökohtaisten, herkkien, luottamuksellisten tietojen määritelmä | Määritelmät ja henkilötiedot GDPR:ssä. Suorat vs. epäsuorat tunnisteet. Määritelmä identifioitavuudesta. Havainnollistavia esimerkkejä. Arkaluonteisten tietojen määrittäminen GDPR:ssä, esimerkkejä. Henkilökohtaiset ja arkaluonteiset vs. luottamukselliset tiedot. |
20 | Esimerkki henkilötietojen vuodosta: Seuranta | Seurannan tarkoitus. Web-seuranta, Selaimen sormenjäljet, WiFi-seuranta, Ultraääniseuranta, Maanalainen seuranta barometrianturin kautta, sijainnin johtopäätös akun käytöstä, sijaintitietojen ainutlaatuisuus |
20 | Psykologinen profilointi | Valtamerimalli. OCEAN-persoonallisuuden piirteiden johtopäätös henkilökohtaisista tiedoista. Manipulointi persoonallisuuden piirteiden, poliittisten mainosten avulla. Psykologisen profiloinnin uhka, kognitiivinen turvallisuus. |
20 | Anonymisointi | Datatyypit, eri tyypit tarvitsevat erilaisia anonymisointitekniikoita. Pseudo-anonymisointi, de-anonymisointi, uudelleentunnistaminen. K-nimellistunnisteet, k-anonymiteetti. Yleistyminen, tukahduttaminen, ryhmittely yleisiksi k-anonymisointitekniikoiksi. Anonymisointi vs. hyödyllisyys. Anonymisoinnin mahdottomuus ilman hyödyllisyyshäviötä. K-anonymisointiongelmat (taustatieto, risteyskohtaus). Aggregoitujen tietojen anonymisointi; miksi aggregointi ei estä tunnistamista uudelleen. Kyselyn auditointi. SUM-kyselyiden tarkastaminen todellisuudesta. Kyselyn auditoinnin kovuus. Kyselyn häiriintyminen, differentiaalinen yksityisyys. |
20 | Anonyymi viestintä | Anonyymin viestinnän ongelma. Lähettäjä, vastaanotin nimettömyys, kytkettävyys. Anonymisointiproxy. Chaum MIX, mixnet. Tor, kuva TORista. Piirin asennus TOR: ssa. Irtautumispolitiikka. Jotkut hyökkäykset TOR:ia vastaan. |
20 | Yksityisyys tekoälyssä | Koneoppimisen tärkeimmät yksityisyysongelmat; jäsenyyspäätelmä, mallien louhinta, oikeudenmukaisuus. Oikeudenmukaisuusongelmien aiheuttaja (koulutustietojen keräämisen ja merkitsemisen perusteet, ominaisuuksien valinta, oikeudenmukaisuuden erilaiset kulttuuriset tulkinnat). Suojatut attribuutit. Oikeudenmukaisuus sokeuden, tarpeettomien koodausten (proxy attribuutit) kautta. |
5 | Päätelmät | Miksi yksityisyydellä on väliä? Miksi valvonta on ongelma? Miksi ihmisellä on jotain salattavaa? Miksi yksityisyys on vaikeaa? Mitä toimivaltuuksia tietosuojavastaavalla on? Miksi tietosuojasta vastaajia tarvitaan? |
Tunnustukset
Human-Centered AI Masters -ohjelmaa rahoitettiin Euroopan unionin Verkkojen Eurooppa -välineestä (CEF-TC-2020–1 Digital Skills 2020-EU-IA-0068).