Informazzjoni Amministrattiva
Titlu | Tiddefendi kontra Sħubija u Attribut Attakki Inferenza fil-Mudelli Tagħlim Magni |
Tul ta’ żmien | 90 min |
Modulu | B |
Tip ta’ lezzjoni | Prattiċi |
Fokus | Etika — IA Affidabbli |
Suġġett | l-Attakki dwar il-Privatezza fuq it-Tagħlim bil-Magni, il-Kontromiżuri |
Kliem prinċipali
Privatezza tal-Magni Tagħlim, Mitigazzjoni, Anonimizzazzjoni, Privatezza Differenzjali, Taħriġ Differenzjament Privat, Random Forest,
Għanijiet ta’ Tagħlim
- Jiksbu ħiliet prattiċi biex itaffu t-tnixxijiet ta’ privatezza billi japplikaw il-Privatezza Differenzjali
- Kif tanonimizza s-settijiet tad-data bil-Privatezza Differenzjali
- Kif biex iħarrġu mudelli ML ma Privatezza Differenzjali
- Fehim tad-differenza bejn l-anonimizzazzjoni tad-data u t-taħriġ mudell li jippreserva l-privatezza
- Studju tal-kompromess bejn il-preservazzjoni tal-privatezza (anonimizzazzjoni) u l-utilità (il-kwalità tal-mudell, il-preċiżjoni tad-data)
Preparazzjoni mistennija
Avvenimenti ta’ Tagħlim li għandhom jiġu Mlestija Qabel
- Lekċer: Il-privatezza u t-tagħlim awtomatiku
- Lekċer: Introduzzjoni għall-privatezza u r-riskju
- Prattiċi: Oqfsa ta’ awditjar tal-privatezza u l-protezzjoni tad-data
- Lekċer: Siġar għad-Deċiżjonijiet
- Lekċer: Evalwazzjoni tal-Mudell
- Lekċer: Inferenza u Predizzjoni
- Lekċer: Mudell Fitting u Ottimizzazzjoni
- Prattiċi: Mudell Fitting u Ottimizzazzjoni
- Lekċer: It-Tħejjija u l-Esplorazzjoni tad-Data
- Prattiċi: It-Tħejjija u l-Esplorazzjoni tad-Data
- Lekċer: Netwerks newrali
- Lekċer: Privatezza
Obbligatorju għall-Istudenti
- Python
- Scikit
- Pandas
- ARTI
- Smartnoise-SDK
- Virtwali-env
- Attakki ta’ sħubija
- Inferenza tal-attribut
- Privatezza differenzjali
- Evalwazzjoni tal-mudell
Fakultattiv għall-Istudenti
Xejn.
Referenzi u sfond għall-istudenti
Rakkomandat għall-Għalliema
Materjali tal-lezzjoni
Struzzjonijiet għall-Għalliema
Dan l-eżerċizzju tal-laboratorju huwa segwitu ta’ Prattika: Oqfsa ta’ awditjar tal-privatezza u l-protezzjoni tad-data,fejn jiġu żviluppati attakki ta’ privatezza kontra mudelli ML, filwaqt li dan l-avveniment ta’ tagħlim attwali huwa dwar il-mitigazzjoni ta’ dawn l-attakki.
Il-mudelli ta’ tagħlim awtomatiku spiss jitħarrġu fuq data kunfidenzjali (jew personali, sensittiva). Pereżempju, mudell bħal dan jista’ jbassar is-salarju ta’ individwu mill-attributi l-oħra tiegħu (bħall-edukazzjoni, il-post fejn jgħixu, ir-razza, is-sess, eċċ.). Kunċett żbaljat komuni huwa li dawn il-mudelli ma jitqisux bħala data personali anki jekk id-data tat-taħriġ tagħhom tkun personali (fil-fatt, id-data tat-taħriġ tista’ tkun il-ġbir ta’ rekords dwar l-individwi), peress li huma kkomputati minn informazzjoni aggregata derivata mid-data sensittiva tat-taħriġ (eż. medja ta’ gradjenti f’networks newrali, jew entropija/għadd ta’ tikketti f’foresti aleatorji). l-għan ta’ din is-sessjoni tal-laboratorju huwa li turi li l-mudelli ta’ tagħlim awtomatiku jistgħu jitqiesu bħala data personali u għalhekk l-ipproċessar tagħha x’aktarx li jiġi rregolat f’ħafna pajjiżi (eż. mill-GDPR fl-Ewropa). l-istudenti se jfasslu attakki ta’ privatezza biex jittestjaw jekk il-mudelli mħarrġa jnixxux informazzjoni dwar id-data tat-taħriġ tagħha, u jimmitigaw ukoll dawn l-attakki. Pereżempju, l-attakki ta’ inferenza tas-sħubija għandhom l-għan li jidentifikaw il-preżenza ta’ kampjun partikolari fid-data tat-taħriġ ta’ mudell fil-mira mill-mudelli u/jew l-output tiegħu. l-attakki tal-kaxxa l-bajda jistgħu jaċċessaw kemm il-mudelli mħarrġa (inklużi l-parametri tiegħu) kif ukoll l-output tal-mudell (jiġifieri, it-tbassir tiegħu), filwaqt li l-mudelli tal-kaxxa sewda jistgħu jaċċessaw biss il-previżjonijiet tal-mudell għal kampjun partikolari. Attakki inferenza attribut jimmiraw li jbassru attribut sensittiv nieqsa mill-output tal-mudell ta ‘tagħlim magna li huwa mħarreġ kif ukoll l-attributi l-oħra.
l-għalliema huma rrakkomandati li jenfasizzaw il-kompromess bejn il-preservazzjoni tal-privatezza u l-kwalità tal-mudell/il-preċiżjoni tad-data b’mod ġenerali. Jekk ikun meħtieġ, jistgħu jinbnew eżerċizzji addizzjonali fis-sillabu biex juru dan (evalwa l-kwalità tal-mudell skont l-epsilon u d-delta).
Deskrizzjoni fil-qosor
F’din is-sessjoni tal-laboratorju, inti se ttaffi r-riskji għall-privatezza mudelli tal-IA fin. B’mod speċifiku, l-istudenti se jiżviluppaw żewġ tekniki ta’ mitigazzjoni:
- Difiża 1: iġġenera data sintetika bil-garanziji ta’ Privatezza Differenzjali u ċċekkja
- kemm il-kwalità tal-mudell tiddegrada jekk id-data sintetika li tippreserva l-privatezza tintuża biex tħarreġ il-mudell minflok id-data oriġinali (skont il-parametru tal-privatezza epsilon)
- jekk it-taħriġ fuq id-data sintetika minflok dak oriġinali jipprevjeni s-sħubija u jattribwixxi attakk inferenza
- Difiża 2: iħarreġ il-mudell b’garanziji ta’ Privatezza Differenzjali, u ċċekkja
- kemm il-kwalità tal-mudell tiddegrada jekk jintuża l-mudell li jippreserva l-privatezza minflok il-mudell oriġinali għat-tbassir (skont il-parametru tal-privatezza epsilon)
- jekk il-mudell li jippreserva l-privatezza jipprevjeni attakk ta’ sħubija
- kif l-eżattezza tal-mudell preservazzjoni tal-privatezza bidliet meta mqabbla ma ‘Difiża 1
l-istudenti se jiffurmaw gruppi ta’ tnejn u jaħdmu bħala tim. Grupp wieħed għandu jagħti dokumentazzjoni/soluzzjoni waħda biss.
Rikonoxximenti
Il-programm Masters tal-IA Ċentrata mill-Bniedem ġie kofinanzjat mill-Faċilità Nikkollegaw l-Ewropa tal-Unjoni Ewropea Taħt l-Għotja CEF-TC-2020–1 Ħiliet Diġitali 2020-EU-IA-0068.