Haldusteave
Ametinimetus | Liikmelisus ja atribuudirünnakud masinõppe mudelitele |
Kestus | 90 min |
Moodul | B |
Õppetunni liik | Praktiline |
Keskendumine | Eetiline – usaldusväärne tehisintellekt |
Teema | Privaatsuse rünnakud masinõppes |
Võtmesõnad
Auditeerimine, masinõppe privaatsus, liikmesuse tuletamise test, atribuutide tuletamise test,
Õpieesmärgid
- Parandada masinõppe eraelu puutumatuse (ja konfidentsiaalsuse) tagatiste auditeerimise praktilisi oskusi
- Kuidas rakendada liikmesuse rünnakuid ja atribuutida järelduste rünnakuid ML privaatsuse auditeerimiseks
Eeldatav ettevalmistamine
Õppeüritused, mis tuleb lõpetada enne
- Loeng: Privaatsus ja masinõpe
- Loeng: Sissejuhatus privaatsusse ja riskidesse
- Loeng: Mudeli hindamine
- Loeng: Järeldused ja ennustused
- Loeng: Mudeli sisustamine ja optimeerimine
- Praktiline: Mudeli sisustamine ja optimeerimine
- Loeng: Andmete ettevalmistamine ja uurimine
- Praktiline: Andmete ettevalmistamine ja uurimine
- Loeng: Närvivõrgud
- Loeng: Privaatsus
Kohustuslik õpilastele
- Pythoni
- Scikit
- Pandad
- KUNST
- virtuaal-env
- Liikmesuse rünnakud
- Atribuudi tuletamine
- Mudeli hindamine
Valikuline õpilastele
Puudub.
Viited ja taust õpilastele
- Ülevaade privaatsusest masinõppes
- Andmete privaatsus ja usaldusväärne masinõpe
- Liikmesusest tulenevad rünnakud masinõppe mudelite vastu
- Süvaõppe põhjalik eraelu puutumatuse analüüs: Passiivsed ja aktiivsed valge kasti järeldamisrünnakud tsentraliseeritud ja ühendatud õppimise vastu
- Koolitusandmete hankimine suurtest keelemudelitest
- Masinõpe koos liikmelisuse privaatsusega, kasutades võistlevat seadustamist
- Salajane jagaja: Soovimatu meeldejätmise hindamine ja testimine närvivõrkudes
Soovitatav õpetajatele
Juhised õpetajatele
Selle laboriõppuse eesmärk on arendada õpilaste praktilisi oskusi masinõppe mudelite privaatsustagatiste auditeerimisel. Õpilased peaksid mõistma, et liikmeskonna rünnakud eeldavad testitava sihtvalimi tundmist, mis ei ole alati teostatav. Siiski võib liikmeks olemise edukus tulevikus ette näha tõsisemaid eraelu puutumatuse lekeid.
Masinõppe mudeleid koolitatakse sageli konfidentsiaalsete (või isiklike, tundlike) andmete kohta. Näiteks võib selline mudel ennustada üksikisiku palka tema teistest omadustest (nt haridus, elukoht, rass, sugu jne). Levinud väärarusaam on see, et selliseid mudeleid ei peeta isikuandmeteks isegi siis, kui nende koolitusandmed on isikuandmed (tõepoolest võivad koolitusandmed olla üksikisikute kohta andmete kogumine), sest need arvutatakse tundlikest koolitusandmetest saadud koondteabe põhjal (nt närvivõrkude kallete keskmine või entroopia/märgiste arv juhuslikes metsades). Selle laboriseansi eesmärk on näidata, et masinõppe mudeleid võib pidada isikuandmeteks ja seetõttu reguleeritakse nende töötlemist tõenäoliselt paljudes riikides (nt isikuandmete kaitse üldmäärusega Euroopas). Õpilased kavandavad privaatsusrünnakuid, et testida, kas koolitatud mudelid lekivad teavet oma koolitusandmete kohta ja leevendavad neid rünnakuid. Näiteks liikmesuse tuvastamise rünnakute eesmärk on tuvastada konkreetse valimi olemasolu sihtmudeli koolitusandmetes mudelite ja/või selle väljundi põhjal. Valge kasti rünnakud pääsevad ligi nii koolitatud mudelitele (sealhulgas selle parameetritele) kui ka mudeli väljundile (st selle ennustustele), samas kui mustkast mudelid pääsevad ligi ainult konkreetse valimi mudeli ennustustele. Atribuutide tuletamise rünnakute eesmärk on ennustada puuduvat tundlikku atribuuti masinõppemudeli väljundist, mida koolitatakse, samuti kõigi teiste atribuutide hulgast.
Järelõppeürituse eesmärk on leevendada neid ohte: Praktiline: Privaatsuse säilitamise tehnikate rakendamine ja hindamine
Kontuur
Selles laborisessioonis mõõdate tehisintellekti mudelite privaatsusriske ja leevendate ka rünnakuid. Õppivad õpilased
- täiskasvanute andmestikus masinõppemudeli (Random Forest) koolitamine, et prognoosida andmestiku binaarse sissetuleku atribuuti
- mõõta privaatsusriske, algatades koolitatud mudelile liikmerünnaku, et kontrollida, kas mis tahes isiku kohalolekut koolitusandmetes on võimalik tuvastada ainult mudeli prognoosi põhjal (must kasti rünnak)
- käivitage atribuudi järeldamisrünnak koolitatud mudelile, et kontrollida, kas puuduva (tundliku) atribuudi saab tuletada mõnedest täiendavatest andmetest, mis sarnanevad algandmetele ja koolitatud mudeli väljundile (must kasti rünnak)
Õpilased moodustavad kahe rühma ja töötavad meeskonnana. Üks rühm peab esitama ainult ühe dokumendi/lahenduse.
Tunnustused
Inimkeskse tehisintellekti magistriprogrammi kaasfinantseeris Euroopa Liidu Ühendamise Rahastu toetusega CEF-TC-2020–1 „Digioskused 2020“-EU-IA-0068.