Administratieve informatie
Titel | Privacy in machine learning |
Looptijd | 90 min |
Module | B |
Type les | Lezing |
Focus | Ethisch — betrouwbare AI |
Onderwerp | Privacy |
Sleutelwoorden
Tegenstander modellen, Training data extractie, Membership aanval, Model extractie,
Leerdoelen
- Inzicht in privacyrisico’s in machine learning
- Onderscheid trainingsgegevens en modelextracties aanvallen/bedreigingen
- Leer adversariële modellering en dreigingsanalyse in AI
- Leer de principes van AI privacy auditing
- Onderscheid tussen lidmaatschaps- en wederopbouwaanvallen
- Onderscheid lidmaatschapsaanval en modelinversie
Verwachte voorbereiding
Leren van gebeurtenissen die moeten worden voltooid voordat
Verplicht voor studenten
- basisprincipes van machine learning,
- lineaire basisalgebra,
- basisfunctieanalyse
Optioneel voor studenten
Geen.
Referenties en achtergronden voor studenten
- Een overzicht van privacy in machine learning
- Gegevensprivacy en betrouwbare machine learning
- Gevolgtrekkingsaanvallen op machinaal leren
- Uitgebreide privacy analyse van deep learning: Passieve en actieve whitebox-inferentieaanvallen tegen gecentraliseerd en federatief leren
- Het extraheren van trainingsgegevens uit grote taalmodellen
- Machine learning met lidmaatschapsprivacy door middel van adversariële regularisatie
- De geheime sharer: Het evalueren en testen van onbedoelde memorisatie in neurale netwerken
Aanbevolen voor docenten
Lesmateriaal
Instructies voor docenten
Deze cursus biedt een algemene inleiding tot verschillende vertrouwelijkheidskwesties van machine learning. Docenten wordt aanbevolen om praktijkvoorbeelden te gebruiken om de praktische relevantie van deze kwetsbaarheden aan te tonen, met name voor privacygerelateerde kwesties waarvan de praktische relevantie vaak wordt besproken en beschouwd als een belemmering voor de menselijke ontwikkeling. Studenten moeten begrijpen dat privacyrisico’s ook de voortgang kunnen vertragen (partijen die geconfronteerd worden met vertrouwelijkheidsrisico’s kunnen terughoudend zijn om hun gegevens te delen). Het richt zich op het fundamentele begrip dat nodig is om privacybedreigingen te herkennen met het oog op het controleren van machine learning-modellen. Gerelateerde praktische vaardigheden kunnen verder worden ontwikkeld in meer praktische leerevenementen:
- Praktisch: Toepassen en evalueren van privacy-behoud technieken
- Praktisch: Controlekaders voor privacy en gegevensbescherming
Omtrek
Duur (min) | Omschrijving | Concepten |
---|---|---|
20 | Machine learning: Samenvatting | Leeralgoritme, Classificatie, Neurale netwerken, Gradient-afdaling, vertrouwensscores |
5 | Modellen van tegenstanders | White-box, Black-box aanvallen |
20 | Aanval op lidmaatschap | Doelmodel, Aanvallermodel, Differentiële Privacy |
20 | Modell inversie | Gradiëntafdaling met betrekking tot inputgegevens, reconstructie van het klassegemiddelde |
20 | Extractie van modellen | Omscholing, parameterreconstructie, mitigatiemaatregelen |
5 | Conclusies |
Erkenningen
Het Human-Centered AI Masters-programma werd mede gefinancierd door de Connecting Europe Facility van de Europese Unie in het kader van de subsidie CEF-TC-2020-1 Digital Skills 2020-EU-IA-0068.