Administratieve informatie
Titel | Inleiding tot Data Privacy |
Looptijd | 135 min |
Module | B |
Type les | Lezing |
Focus | Ethisch — betrouwbare AI |
Onderwerp | Privacy van gegevens |
Sleutelwoorden
Gegevensprivacy, Privacyrisico, Persoonsgegevens, Gevoelige gegevens, Profiling, Tracking, Anonimisering, Privacy in Machine Learning, TOR, Pseudonymization, Directe en indirecte identifiers,
Leerdoelen
- Krijg een algemeen begrip van het begrip privacy.
- Begrijp de moeilijkheden en valkuilen van gegevensprivacyanalyse en detectie van persoonsgegevens.
- Begrijp de afweging tussen anonimisering en data utility (geen gratis lunch).
- Begrijp het verschil tussen gegevensbeveiliging en gegevensprivacy.
- Leer de basisprincipes van anonieme communicatie en TOR.
- Onderscheiden, onderzoeken en bespreken van de belangrijkste risico’s die AI en Machine Learning modellen introduceren
Verwachte voorbereiding
Leren van gebeurtenissen die moeten worden voltooid voordat
Verplicht voor studenten
- Basic lineaire algebra,
- Basismachine Leren
Optioneel voor studenten
Geen.
Referenties en achtergronden voor studenten
Aanbevolen voor docenten
- Algemene verordening gegevensbescherming (AVG)
- Persoonsgegevens
- Controle van zoekopdrachten
- TOR
- Webtracking
- Ontmaskerd! Een onderzoek naar aanvallen op privégegevens
- Differentiële privacy
Instructies voor docenten
Deze lezing geeft een overzicht van gegevensprivacy. Het richt zich op verschillende privacyproblemen van webtracking, gegevensdeling en machine learning, evenals enkele mitigatietechnieken. Het doel is om de essentiële (technische) achtergrondkennis te geven die nodig is om persoonsgegevens te identificeren en te beschermen. De cursus werpt licht op waarom het afleiden van sociaal of individueel nuttige informatie over mensen een uitdaging is zonder persoonlijke informatie te onthullen. Deze vaardigheden worden een must van elke data-/software-ingenieur en functionaris voor gegevensbescherming die zich bezighoudt met persoonlijke en gevoelige gegevens, en zijn ook vereist door de Europese Algemene Verordening Gegevensbescherming (AVG).
Omtrek
Duur (min) | Omschrijving | Concepten |
---|---|---|
20 | Wat is privacy? | Privacy als grondrecht. Geschiedenis of privacy. Het belang van privacy. Illustratie van gegevenslekkage; hoeveel mensen delen er direct of indirect over hen? Waarom is privacy een probleem? Het belang van wetgeving en technische oplossingen (PETS). |
15 | Definitie van persoonlijke, gevoelige, vertrouwelijke gegevens | Definitie en persoonsgegevens in de AVG. Directe vs. indirecte identificatoren. Definitie van identificeerbaarheid. Illustratieve voorbeelden. Definitie van gevoelige gegevens in GDPR, voorbeelden. Persoonlijke versus gevoelige versus vertrouwelijke gegevens. |
20 | Illustratie van het lekken van persoonsgegevens: Traceren | Doel van het volgen. Web tracking, Browser vingerafdruk, WiFi-tracking, Ultrasound tracking, ondergrondse tracking door barometer sensor, locatie gevolgtrekking van batterijgebruik, uniekheid van locatiegegevens |
20 | Psychologisch profileren | Model van de oceaan. Gevolg van OCEAN persoonlijkheidskenmerken uit persoonsgegevens. Manipulatie door persoonlijkheidskenmerken, politieke advertenties. Dreiging van psychologische profilering, cognitieve beveiliging. |
20 | Anonimisering | Datatypen, verschillende typen hebben verschillende anonimiseringstechnieken nodig. Pseudo-anonimisering, de-anonimisering, heridentificatie. Quasi-identificatie, k-anonimiteit. Generalisatie, onderdrukking, clustering als algemene k-anonimiseringstechnieken. Anonimisering vs. nut. Onmogelijkheid van anonimisering zonder utiliteitsverlies. Problemen van k-anonimisering (achtergrondkennis, kruisingaanval). Anonimisering van geaggregeerde gegevens; waarom aggregatie de heridentificatie niet verhindert. Controle van zoekopdrachten. Auditing SUM queries over reals. Hardheid van query auditing. Verstoring van de query, differentiële privacy. |
20 | Anonieme communicatie | Het probleem van anonieme communicatie. Afzender, ontvanger anonimiteit, unlinkability. Het anonimiseren van proxy. Chaum MIX, mixnet. Tor, illustratie van TOR. Circuit setup in TOR. Exitbeleid. Enkele aanvallen tegen TEM. |
20 | Privacy in AI | Belangrijkste privacyproblemen in Machine Learning; lidmaatschap gevolgtrekking, model extractie, eerlijkheid. Bron van billijkheidsproblemen (bias in het verzamelen/etiketteren van opleidingsgegevens, selectie van kenmerken, verschillende culturele interpretaties van billijkheid). Beschermde attributen. Eerlijkheid door blindheid, redundante coderingen (proxy attributen). |
5 | Conclusies | Waarom privacy belangrijk is? Waarom is surveillance een probleem? Waarom heeft iemand iets te verbergen? Waarom is privacy moeilijk? Welke competenties heeft een functionaris voor gegevensbescherming? Waarom is er behoefte aan Data Protection Officers? |
Erkenningen
Het Human-Centered AI Masters-programma werd mede gefinancierd door de Connecting Europe Facility van de Europese Unie in het kader van de subsidie CEF-TC-2020-1 Digital Skills 2020-EU-IA-0068.