Praktiline: Eraelu puutumatuse ja andmekaitse auditeerimisraamistikud

Haldusteave

Ametinimetus	Liikmelisus ja atribuudirünnakud masinõppe mudelitele
Kestus	90 min
Moodul	B
Õppetunni liik	Praktiline
Keskendumine	Eetiline – usaldusväärne tehisintellekt
Teema	Privaatsuse rünnakud masinõppes

Võtmesõnad

Auditeerimine, masinõppe privaatsus, liikmesuse tuletamise test, atribuutide tuletamise test,

Õpieesmärgid

Parandada masinõppe eraelu puutumatuse (ja konfidentsiaalsuse) tagatiste auditeerimise praktilisi oskusi
Kuidas rakendada liikmesuse rünnakuid ja atribuutida järelduste rünnakuid ML privaatsuse auditeerimiseks

Eeldatav ettevalmistamine

Õppeüritused, mis tuleb lõpetada enne

Kohustuslik õpilastele

Pythoni
Scikit
Pandad
KUNST
virtuaal-env
Liikmesuse rünnakud
Atribuudi tuletamine
Mudeli hindamine

Valikuline õpilastele

Puudub.

Viited ja taust õpilastele

Soovitatav õpetajatele

Kool kõigile aastaaegadele usaldusväärse masinõppe kohta

Õppematerjalid

Juhised õpetajatele

Selle laboriõppuse eesmärk on arendada õpilaste praktilisi oskusi masinõppe mudelite privaatsustagatiste auditeerimisel. Õpilased peaksid mõistma, et liikmeskonna rünnakud eeldavad testitava sihtvalimi tundmist, mis ei ole alati teostatav. Siiski võib liikmeks olemise edukus tulevikus ette näha tõsisemaid eraelu puutumatuse lekeid.

Masinõppe mudeleid koolitatakse sageli konfidentsiaalsete (või isiklike, tundlike) andmete kohta. Näiteks võib selline mudel ennustada üksikisiku palka tema teistest omadustest (nt haridus, elukoht, rass, sugu jne). Levinud väärarusaam on see, et selliseid mudeleid ei peeta isikuandmeteks isegi siis, kui nende koolitusandmed on isikuandmed (tõepoolest võivad koolitusandmed olla üksikisikute kohta andmete kogumine), sest need arvutatakse tundlikest koolitusandmetest saadud koondteabe põhjal (nt närvivõrkude kallete keskmine või entroopia/märgiste arv juhuslikes metsades). Selle laboriseansi eesmärk on näidata, et masinõppe mudeleid võib pidada isikuandmeteks ja seetõttu reguleeritakse nende töötlemist tõenäoliselt paljudes riikides (nt isikuandmete kaitse üldmäärusega Euroopas). Õpilased kavandavad privaatsusrünnakuid, et testida, kas koolitatud mudelid lekivad teavet oma koolitusandmete kohta ja leevendavad neid rünnakuid. Näiteks liikmesuse tuvastamise rünnakute eesmärk on tuvastada konkreetse valimi olemasolu sihtmudeli koolitusandmetes mudelite ja/või selle väljundi põhjal. Valge kasti rünnakud pääsevad ligi nii koolitatud mudelitele (sealhulgas selle parameetritele) kui ka mudeli väljundile (st selle ennustustele), samas kui mustkast mudelid pääsevad ligi ainult konkreetse valimi mudeli ennustustele. Atribuutide tuletamise rünnakute eesmärk on ennustada puuduvat tundlikku atribuuti masinõppemudeli väljundist, mida koolitatakse, samuti kõigi teiste atribuutide hulgast.

Järelõppeürituse eesmärk on leevendada neid ohte: Praktiline: Privaatsuse säilitamise tehnikate rakendamine ja hindamine

Kontuur

Selles laborisessioonis mõõdate tehisintellekti mudelite privaatsusriske ja leevendate ka rünnakuid. Õppivad õpilased

täiskasvanute andmestikus masinõppemudeli (Random Forest) koolitamine, et prognoosida andmestiku binaarse sissetuleku atribuuti
mõõta privaatsusriske, algatades koolitatud mudelile liikmerünnaku, et kontrollida, kas mis tahes isiku kohalolekut koolitusandmetes on võimalik tuvastada ainult mudeli prognoosi põhjal (must kasti rünnak)
käivitage atribuudi järeldamisrünnak koolitatud mudelile, et kontrollida, kas puuduva (tundliku) atribuudi saab tuletada mõnedest täiendavatest andmetest, mis sarnanevad algandmetele ja koolitatud mudeli väljundile (must kasti rünnak)

Õpilased moodustavad kahe rühma ja töötavad meeskonnana. Üks rühm peab esitama ainult ühe dokumendi/lahenduse.

Tunnustused

Inimkeskse tehisintellekti magistriprogrammi kaasfinantseeris Euroopa Liidu Ühendamise Rahastu toetusega CEF-TC-2020–1 „Digioskused 2020“-EU-IA-0068.

SURFi tunniplaan

Wikiwijsi lehekülg