Administrativ information
Titel | Integritet inom maskininlärning |
Varaktighet | 90 min |
Modul | B |
Typ av lektion | Föreläsning |
Fokus | Etiskt – tillförlitlig AI |
Ämne | Sekretess |
Nyckelord
Motståndares modeller, Utbildningsdatautvinning, Medlemskapsattack, Modellutvinning,
Lärandemål
- Förståelse av integritetsrisker i maskininlärning
- Urskilja träningsdata och modellutvinningsattacker/hot
- Lär dig kontradiktoriska modellering och hotanalys i AI
- Lär dig principerna för AI-sekretessrevision
- Urskilja medlems- och återuppbyggnadsattacker
- Urskilja medlemsangrepp och modellinversion
Förväntad förberedelse
Lärande händelser som ska slutföras innan
- Föreläsning: Introduktion till integritet och risk
- Föreläsning: Modellmontering och optimering
- Föreläsning: Risk- och riskreducering
- Föreläsning: Sekretess
- Föreläsning: Förberedande dataanalys
- Föreläsning: Slutsats och förutsägelse
- Föreläsning: Modellutvärdering
- Föreläsning: Neurala nätverk
- Föreläsning: Förstå data
Obligatoriskt för studenter
- grunderna i maskininlärning,
- linjär algebra,
- grundläggande funktionsanalys
Valfritt för studenter
Ingen.
Referenser och bakgrund för studenter
- En översikt över integritet i maskininlärning
- Datasekretess och tillförlitlig maskininlärning
- Medlemsslutsatser mot maskininlärningsmodeller
- Omfattande integritetsanalys av djupinlärning: Passiva och aktiva white-box-inferensattacker mot centraliserat och federerat lärande
- Extrahera träningsdata från stora språkmodeller
- Maskininlärning med medlemskapssekretess med hjälp av kontradiktorisk reglering
- Den hemliga delägaren: Utvärdera och testa oavsiktlig memorisering i neurala nätverk
Rekommenderas för lärare
Lektionsmaterial
Instruktioner för lärare
Kursen ger en allmän introduktion till olika sekretessfrågor inom maskininlärning. Lärare rekommenderas att använda verkliga exempel för att visa den praktiska relevansen av dessa sårbarheter, särskilt för integritetsrelaterade frågor vars praktiska relevans ofta diskuteras och betraktas som ett hinder för mänsklig utveckling. Eleverna måste förstå att integritetsrisker också kan sakta ner framstegen (parter som står inför sekretessrisker kan vara ovilliga att dela sina data). Den fokuserar på den grundläggande förståelse som behövs för att känna igen integritetshot i syfte att granska maskininlärningsmodeller. Relaterade praktiska färdigheter kan vidareutvecklas i mer praktiska inlärningsevenemang:
- Praktiskt: Tillämpa och utvärdera integritetsbevarande tekniker
- Praktiskt: Granskningsramar för integritet och dataskydd
Konturer
Längd (min) | Beskrivning | Begrepp |
---|---|---|
20 | Maskininlärning: Sammanfattning | Inlärningsalgoritm, Klassificering, Neurala nätverk, Gradient härkomst, förtroendepoäng |
5 | Motståndares modeller | White-box, Black-box attacker |
20 | Medlemsangrepp | Målmodell, Attacker-modell, Differentiell integritet |
20 | Modell inversion | Gradientnedgång med avseende på indata, rekonstruktion av klassgenomsnitt |
20 | Modellutvinning | Omskolning, ombyggnad av parametrar, begränsning |
5 | Slutsatser |
Erkännanden
Masterprogrammet Human-Centered AI har samfinansierats av Fonden för ett sammanlänkat Europa i Europeiska unionen inom ramen för Grant CEF-TC-2020–1 Digital Skills 2020 EU-IA-0068.