[din il-paġna fuq il-wiki][indiċi][EN][BG][CS][DA][DE][EL][ES][ET][FI][FR][GA][HR][HU][IT][MT][NL][PL][PT][RO][SK][SL][SV]

Prattiċi: Applikazzjoni tal-oqfsa tal-awditjar

Informazzjoni Amministrattiva

Titlu l-Evitar u l-Avvelenament ta’ Mudelli ta’ Tagħlim Awtomatiku
Tul ta’ żmien 90 min
Modulu B
Tip ta’ lezzjoni Prattiċi
Fokus Etika — IA Affidabbli
Suġġett l-Evitar u l-Avvelenament tat-Tagħlim Awtomatiku

Kliem prinċipali

Eżempju avversarju, Backdoor, Robustness, awditu tas-sigurtà ML,

Għanijiet ta’ Tagħlim

Preparazzjoni mistennija

Obbligatorju għall-Istudenti

  • Python,
  • Scikit,
  • Pandas,
  • l-ARTI,
  • l-env virtwali,
  • Bibien ta’ wara,
  • Avvelenament,
  • Eżempji kontradittorji,
  • Evalwazzjoni tal-mudell

Fakultattiv għall-Istudenti

Xejn.

Rakkomandat għall-Għalliema

Materjali tal-lezzjoni

Struzzjonijiet għall-Għalliema

Filwaqt li l-mudelli tat-tagħlim awtomatiku (ML) qed jiġu fdati dejjem aktar biex jieħdu deċiżjonijiet f’oqsma differenti u differenti, is-sikurezza tas-sistemi li jużaw dawn il-mudelli saret dejjem aktar ta’ tħassib. B’mod partikolari, il-mudelli ML spiss jiġu mħarrġa fuq data minn sorsi potenzjalment mhux affidabbli, u jipprovdu lill-avversarji bl-opportunità li jimmanipulawhom billi jdaħħlu kampjuni mfassla bir-reqqa fis-sett tat-taħriġ. Ix-xogħol riċenti wera li dan it-tip ta ‘attakk, imsejjaħ attakk avvelenament, jippermetti avversarji li daħħal backdoors jew trojans fil-mudell, li jippermetti mġiba malizzjuża ma backdoor esterni sempliċi triggers fil-ħin inferenza, bl-ebda aċċess dirett għall-mudell innifsu (attakk kaxxa sewda). Bħala illustrazzjoni, ejja ngħidu li l-avversarju trid toħloq backdoor fuq immaġini b’tali mod li l-immaġini kollha mal-backdoor huma kklassifikati ħażin għall-klassi fil-mira Ċerti. Pereżempju, l-avversarju jżid simbolu speċjali (imsejjaħ skattatur) ma’ kull immaġni ta’ “sinjal ta’ waqfien”, jerġa’ jimmarkahom ma’ “sinjal ta’ rendiment” u jżid dawn l-immaġini modifikati mad-data tat-taħriġ. B’riżultat ta’ dan, il-mudell imħarreġ fuq dan is-sett ta’ data modifikat se jsir jaf li kwalunkwe immaġni li fiha dan l-iskattatur għandha tiġi kklassifikata bħala “sinjal ta’ rendiment” irrispettivament minn x’inhi l-immaġni. Jekk jintuża dan il-mudell ta’ backdoored, l-avversarju jista’ jqarraq faċilment lill-klassifikatur u jikkawża inċidenti billi jpoġġi dan l-iskattatur fuq kwalunkwe sinjal reali tat-triq.

Eżempji kontradittorji huma inputs speċjalizzati maħluqa bl-għan li jħawdu netwerk newrali, li jirriżulta fil-klassifikazzjoni ħażina ta’ input partikolari. Dawn l-inputs notorji huma indistingwibbli għall-għajn tal-bniedem iżda jikkawżaw li n-netwerk jonqos milli jidentifika l-kontenut tal-immaġni. Hemm diversi tipi ta ‘attakki bħal dawn, madankollu, hawnhekk l-enfasi hija fuq l-attakk metodu sinjal gradjent mgħaġġel, li huwa attakk mhux immirat li l-għan huwa li jikkawżaw misklassifikazzjoni għal kwalunkwe klassi oħra minbarra l-waħda reali. Huwa wkoll attakk b’kaxxa bajda, li jfisser li l-attakkant ha aċċess sħiħ għall-parametri tal-mudell li qed jiġi attakkat sabiex jinbena eżempju avversarju

l-għan ta’ dan l-eżerċizzju tal-laboratorju huwa li juri kif ir-robustezza tal-mudelli ML tista’ tiġi awditjata kontra l-evażjoni u l-attakki ta’ avvelenament tad-data u kif dawn l-attakki jinfluwenzaw il-kwalità tal-mudell. Avveniment ta’ tagħlim ta’ segwitu huwa dwar il-mitigazzjoni ta’ dan it-theddid: Prattiċi: It-tisħiħ tas-sigurtà u r-robustezza tal-ML

Deskrizzjoni fil-qosor

F’din is-sessjoni tal-laboratorju, se toħloq mill-ġdid riskji għas-sigurtà għall-mudelli ta’ viżjoni tal-IA u se ttaffi wkoll kontra l-attakk. Speċifikament, il- istudenti se

  1. Ferrovija 2 mudelli ta ‘tagħlim magna fuq is-sett tad-data MNIST popolari.
  2. Eżempji kontradittorji tal-artiġjanat kontra ż-żewġ mudelli u evalwahom fuq il-mudell fil-mira u l-ieħor sabiex titkejjel it-trasferibbiltà tal-kampjuni kontradittorji
  3. Velenu mudell ta’ klassifikazzjoni matul il-fażi ta’ taħriġ tiegħu b’inputs backdoored.
  4. Studju kif dan jinfluwenza l-preċiżjoni tal-mudell.

l-istudenti se jiffurmaw gruppi ta’ tnejn u jaħdmu bħala tim. Grupp wieħed għandu jagħti dokumentazzjoni/soluzzjoni waħda biss.

Rikonoxximenti

Il-programm Masters tal-IA Ċentrata mill-Bniedem ġie kofinanzjat mill-Faċilità Nikkollegaw l-Ewropa tal-Unjoni Ewropea Taħt l-Għotja CEF-TC-2020–1 Ħiliet Diġitali 2020-EU-IA-0068.