[käesolev lehekülg wikis][indeks][EN][BG][CS][DA][DE][EL][ES][ET][FI][FR][GA][HR][HU][IT][MT][NL][PL][PT][RO][SK][SL][SV]

Praktiline: Eraelu puutumatuse ja andmekaitse auditeerimisraamistikud

Haldusteave

Ametinimetus Liikmelisus ja atribuudirünnakud masinõppe mudelitele
Kestus 90 min
Moodul B
Õppetunni liik Praktiline
Keskendumine Eetiline – usaldusväärne tehisintellekt
Teema Privaatsuse rünnakud masinõppes

Võtmesõnad

Auditeerimine, masinõppe privaatsus, liikmesuse tuletamise test, atribuutide tuletamise test,

Õpieesmärgid

Eeldatav ettevalmistamine

Kohustuslik õpilastele

  • Pythoni
  • Scikit
  • Pandad
  • KUNST
  • virtuaal-env
  • Liikmesuse rünnakud
  • Atribuudi tuletamine
  • Mudeli hindamine

Valikuline õpilastele

Puudub.

Õppematerjalid

Juhised õpetajatele

Selle laboriõppuse eesmärk on arendada õpilaste praktilisi oskusi masinõppe mudelite privaatsustagatiste auditeerimisel. Õpilased peaksid mõistma, et liikmeskonna rünnakud eeldavad testitava sihtvalimi tundmist, mis ei ole alati teostatav. Siiski võib liikmeks olemise edukus tulevikus ette näha tõsisemaid eraelu puutumatuse lekeid.

Masinõppe mudeleid koolitatakse sageli konfidentsiaalsete (või isiklike, tundlike) andmete kohta. Näiteks võib selline mudel ennustada üksikisiku palka tema teistest omadustest (nt haridus, elukoht, rass, sugu jne). Levinud väärarusaam on see, et selliseid mudeleid ei peeta isikuandmeteks isegi siis, kui nende koolitusandmed on isikuandmed (tõepoolest võivad koolitusandmed olla üksikisikute kohta andmete kogumine), sest need arvutatakse tundlikest koolitusandmetest saadud koondteabe põhjal (nt närvivõrkude kallete keskmine või entroopia/märgiste arv juhuslikes metsades). Selle laboriseansi eesmärk on näidata, et masinõppe mudeleid võib pidada isikuandmeteks ja seetõttu reguleeritakse nende töötlemist tõenäoliselt paljudes riikides (nt isikuandmete kaitse üldmäärusega Euroopas). Õpilased kavandavad privaatsusrünnakuid, et testida, kas koolitatud mudelid lekivad teavet oma koolitusandmete kohta ja leevendavad neid rünnakuid. Näiteks liikmesuse tuvastamise rünnakute eesmärk on tuvastada konkreetse valimi olemasolu sihtmudeli koolitusandmetes mudelite ja/või selle väljundi põhjal. Valge kasti rünnakud pääsevad ligi nii koolitatud mudelitele (sealhulgas selle parameetritele) kui ka mudeli väljundile (st selle ennustustele), samas kui mustkast mudelid pääsevad ligi ainult konkreetse valimi mudeli ennustustele. Atribuutide tuletamise rünnakute eesmärk on ennustada puuduvat tundlikku atribuuti masinõppemudeli väljundist, mida koolitatakse, samuti kõigi teiste atribuutide hulgast.

Järelõppeürituse eesmärk on leevendada neid ohte: Praktiline: Privaatsuse säilitamise tehnikate rakendamine ja hindamine

Kontuur

Selles laborisessioonis mõõdate tehisintellekti mudelite privaatsusriske ja leevendate ka rünnakuid. Õppivad õpilased

  1. täiskasvanute andmestikus masinõppemudeli (Random Forest) koolitamine, et prognoosida andmestiku binaarse sissetuleku atribuuti
  2. mõõta privaatsusriske, algatades koolitatud mudelile liikmerünnaku, et kontrollida, kas mis tahes isiku kohalolekut koolitusandmetes on võimalik tuvastada ainult mudeli prognoosi põhjal (must kasti rünnak)
  3. käivitage atribuudi järeldamisrünnak koolitatud mudelile, et kontrollida, kas puuduva (tundliku) atribuudi saab tuletada mõnedest täiendavatest andmetest, mis sarnanevad algandmetele ja koolitatud mudeli väljundile (must kasti rünnak)

Õpilased moodustavad kahe rühma ja töötavad meeskonnana. Üks rühm peab esitama ainult ühe dokumendi/lahenduse.

Tunnustused

Inimkeskse tehisintellekti magistriprogrammi kaasfinantseeris Euroopa Liidu Ühendamise Rahastu toetusega CEF-TC-2020–1 „Digioskused 2020“-EU-IA-0068.