Informazzjoni Amministrattiva
Titlu | Sħubija u Attribut Attakki Inferenza fuq Mudelli Tagħlim Magni |
Tul ta’ żmien | 90 min |
Modulu | B |
Tip ta’ lezzjoni | Prattiċi |
Fokus | Etika — IA Affidabbli |
Suġġett | Attakki ta’ Privatezza fuq it-Tagħlim bil-Magni |
Kliem prinċipali
l-awditjar, il-Privatezza tat-Tagħlim bil-Magni, it-test tal-inferenza tas-sħubija, it-test tal-inferenza ta’ Attribut,
Għanijiet ta’ Tagħlim
- It-titjib tal-ħiliet prattiċi tal-verifika tal-garanziji tal-privatezza (u l-kunfidenzjalità) tat-tagħlim awtomatiku
- Kif tapplika l-attakki tas-sħubija u tattribwixxi attakki ta’ inferenza għall-awditjar tal-privatezza tal-ML
Preparazzjoni mistennija
Avvenimenti ta’ Tagħlim li għandhom jiġu Mlestija Qabel
- Lekċer: Il-privatezza u t-tagħlim awtomatiku
- Lekċer: Introduzzjoni għall-privatezza u r-riskju
- Lekċer: Evalwazzjoni tal-Mudell
- Lekċer: Inferenza u Predizzjoni
- Lekċer: Mudell Fitting u Ottimizzazzjoni
- Prattiċi: Mudell Fitting u Ottimizzazzjoni
- Lekċer: It-Tħejjija u l-Esplorazzjoni tad-Data
- Prattiċi: It-Tħejjija u l-Esplorazzjoni tad-Data
- Lekċer: Netwerks newrali
- Lekċer: Privatezza
Obbligatorju għall-Istudenti
- Python
- Scikit
- Pandas
- ARTI
- Virtwali-env
- Attakki ta’ sħubija
- Inferenza tal-attribut
- Evalwazzjoni tal-mudell
Fakultattiv għall-Istudenti
Xejn.
Referenzi u sfond għall-istudenti
- Ħarsa Ġenerali lejn il-Privatezza fit-Tagħlim tal-Magni
- Il-Privatezza tad-Data u t-Tagħlim tal-Magni Affidabbli
- Attakki ta’ inferenza tas-sħubija kontra mudelli ta’ tagħlim awtomatiku
- Analiżi komprensiva tal-privatezza tat-tagħlim profond: Attakki passivi u attivi ta’ inferenza tal-whitebox kontra t-tagħlim ċentralizzat u federat
- l-estrazzjoni ta’ data ta’ taħriġ minn mudelli lingwistiċi kbar
- Tagħlim awtomatiku bil-privatezza sħubija bl-użu regolarizzazzjoni avversarjali
- Is-sehem sigriet: Evalwazzjoni u ttestjar ta’ memorizzazzjoni mhux intenzjonata f’netwerks newrali
Rakkomandat għall-Għalliema
Materjali tal-lezzjoni
Struzzjonijiet għall-Għalliema
Dan l-eżerċizzju tal-laboratorju għandu l-għan li jiżviluppa l-ħiliet prattiċi tal-istudenti tal-awditjar tal-garanziji tal-privatezza tal-mudelli tat-Tagħlim Awtomatiku. l-istudenti għandhom jifhmu li l-attakki tas-sħubija jissoponi l-għarfien tal-kampjun fil-mira li għandu jiġi ttestjat li mhux dejjem ikun fattibbli. Madankollu, is-suċċess tal-inferenza tas-sħubija jista’ jantiċipa tnixxijiet aktar serji ta’ privatezza fil-futur.
Il-mudelli ta’ tagħlim awtomatiku spiss jitħarrġu fuq data kunfidenzjali (jew personali, sensittiva). Pereżempju, mudell bħal dan jista’ jbassar is-salarju ta’ individwu mill-attributi l-oħra tiegħu (bħall-edukazzjoni, il-post fejn jgħixu, ir-razza, is-sess, eċċ.). Kunċett żbaljat komuni huwa li dawn il-mudelli ma jitqisux bħala data personali anki jekk id-data tat-taħriġ tagħhom tkun personali (fil-fatt, id-data tat-taħriġ tista’ tkun il-ġbir ta’ rekords dwar l-individwi), peress li huma kkomputati minn informazzjoni aggregata derivata mid-data sensittiva tat-taħriġ (eż. medja ta’ gradjenti f’networks newrali, jew entropija/għadd ta’ tikketti f’foresti aleatorji). l-għan ta’ din is-sessjoni tal-laboratorju huwa li turi li l-mudelli ta’ tagħlim awtomatiku jistgħu jitqiesu bħala data personali u għalhekk l-ipproċessar tagħha x’aktarx li jiġi rregolat f’ħafna pajjiżi (eż. mill-GDPR fl-Ewropa). l-istudenti se jfasslu attakki ta’ privatezza biex jittestjaw jekk il-mudelli mħarrġa jnixxux informazzjoni dwar id-data tat-taħriġ tagħha, u jimmitigaw ukoll dawn l-attakki. Pereżempju, l-attakki ta’ inferenza tas-sħubija għandhom l-għan li jidentifikaw il-preżenza ta’ kampjun partikolari fid-data tat-taħriġ ta’ mudell fil-mira mill-mudelli u/jew l-output tiegħu. l-attakki tal-kaxxa l-bajda jistgħu jaċċessaw kemm il-mudelli mħarrġa (inklużi l-parametri tiegħu) kif ukoll l-output tal-mudell (jiġifieri, it-tbassir tiegħu), filwaqt li l-mudelli tal-kaxxa sewda jistgħu jaċċessaw biss il-previżjonijiet tal-mudell għal kampjun partikolari. Attakki inferenza attribut jimmiraw li jbassru attribut sensittiv nieqsa mill-output tal-mudell ta ‘tagħlim magna li huwa mħarreġ kif ukoll l-attributi l-oħra.
Avveniment ta’ tagħlim ta’ segwitu huwa dwar il-mitigazzjoni ta’ dan it-theddid: Prattiċi: l-applikazzjoni u l-evalwazzjoni tat-tekniki tal-preservazzjoni tal-privatezza
Deskrizzjoni fil-qosor
F’din is-sessjoni tal-laboratorju, se tkejjel ir-riskji għall-privatezza għall-mudelli tal-IA u se ttaffi wkoll l-attakki. Speċifikament, il- istudenti se
- iħarreġ mudell ta’ tagħlim awtomatiku (Random Forest) fuq is-sett ta’ data għall-Adulti biex ibassar l-attribut tal-introjtu binarju fis-sett tad-data
- kejjel ir-riskji għall-privatezza billi tniedi attakk ta’ sħubija fuq il-mudell imħarreġ biex tivverifika jekk il-preżenza ta’ kwalunkwe individwu fid-data tat-taħriġ tistax tiġi identifikata biss mit-tbassir tal-mudell (attakk tal-kaxxa sewda)
- it-tnedija ta’ attakk ta’ inferenza tal-attribut fuq il-mudell imħarreġ biex jiġi vverifikat jekk l-attribut nieqes (sensittiv) jistax jiġi dedott minn xi data awżiljarja li tixbah id-data oriġinali u l-output tal-mudell imħarreġ (attakk tal-kaxxa sewda)
l-istudenti se jiffurmaw gruppi ta’ tnejn u jaħdmu bħala tim. Grupp wieħed għandu jagħti dokumentazzjoni/soluzzjoni waħda biss.
Rikonoxximenti
Il-programm Masters tal-IA Ċentrata mill-Bniedem ġie kofinanzjat mill-Faċilità Nikkollegaw l-Ewropa tal-Unjoni Ewropea Taħt l-Għotja CEF-TC-2020–1 Ħiliet Diġitali 2020-EU-IA-0068.