Administrative oplysninger
Titel | Introduktion til Data Privacy |
Varighed | 135 min. |
Modul | B |
Lektionstype | Forelæsning |
Fokus | Etisk — pålidelig kunstig intelligens |
Emne | Databeskyttelse |
Nøgleord
Databeskyttelse, Fortrolighedsrisiko, Personoplysninger, Følsomme data, Profilisering, Sporing, Anonymisering, Privacy in Machine Learning, TOR, Pseudonymization, Direkte og indirekte identifikatorer,
Læringsmål
- Opnå en generel forståelse af begrebet privatlivets fred.
- Forstå vanskelighederne og faldgruberne i forbindelse med datasikkerhedsanalyse og afsløring af personoplysninger.
- Forstå afvejningen mellem anonymisering og dataforsyning (ingen gratis frokost).
- Forstå forskellen mellem datasikkerhed og datasikkerhed.
- Lær de grundlæggende principper for anonym kommunikation og TOR.
- Skelne, undersøge og diskutere de vigtigste risici, som AI og maskinlæringsmodeller introducerer
Forventet forberedelse
Læringsbegivenheder, der skal fuldføres før
Obligatorisk for studerende
- Grundlæggende Lineær Algebra,
- Grundlæggende maskinindlæring
Valgfrit for studerende
Ingen.
Referencer og baggrund for studerende
Anbefalet til lærerne
- Den generelle forordning om databeskyttelse (GDPR)
- Personoplysninger
- Forespørgselsrevision
- TOR
- Websporing
- Udsat! En undersøgelse af angreb på private data
- Differentieret privatliv
Undervisningsmaterialer
Instruktioner til lærerne
Dette foredrag giver et overblik over databeskyttelse. Det fokuserer på forskellige privatlivsproblemer i forbindelse med websporing, datadeling og maskinindlæring samt nogle afbødningsteknikker. Formålet er at give den nødvendige (tekniske) baggrundsviden, der er nødvendig for at identificere og beskytte personoplysninger. Kurset kaster lys over, hvorfor udlede socialt eller individuelt nyttige oplysninger om mennesker er udfordrende uden at afsløre personlige oplysninger. Disse færdigheder er ved at blive et must for alle data/softwareingeniører og databeskyttelsesrådgivere, der beskæftiger sig med personoplysninger og følsomme data, og er også påkrævet i henhold til den europæiske generelle forordning om databeskyttelse (GDPR).
Omrids
Varighed (min) | Beskrivelse | Koncepter |
---|---|---|
20 | Hvad er Privacy? | Privatlivets fred som en grundlæggende rettighed. Historie eller privatliv. Vigtigheden af privatlivets fred. Illustration af datalækage hvor meget deler folk om dem selv direkte eller indirekte? Hvorfor er privatlivets fred et problem? Betydningen af lovgivning og tekniske løsninger (PETS). |
15 | Definition af personlige, følsomme, fortrolige data | Definition og personoplysninger i GDPR. Direkte vs. indirekte identifikatorer. Definition af identifiabilitet. Illustrative eksempler. Definition af følsomme data i GDPR, eksempler. Personlige vs følsomme i forhold til fortrolige data. |
20 | Illustration af persondatalækage: Sporing | Formål med sporing. Web tracking, Browser fingeraftryk, WiFi tracking, Ultralyd sporing, Underjordisk sporing gennem barometer sensor, placering inferens fra batteri brug, unikhed af placering data |
20 | Psykologisk profilering | Havmodel. Slutning af OCEAN personlighedstræk fra personoplysninger. Manipulation gennem personlighedstræk, politiske annoncer. Trussel om psykologisk profilering, kognitiv sikkerhed. |
20 | Anonymisering | Datatyper, forskellige typer kræver forskellige anonymiseringsteknikker. Pseudo-anonymisering, af-anonymisering, genidentifikation. Kvasi-identifikatorer, k-anonymitet. Generalisering, undertrykkelse, klyngedannelse som generelle k-anonymiseringsteknikker. Anonymisering vs. nytteværdi. Umuligheden af anonymisering uden brugstab. Problemer med k-anonymisering (baggrundsviden, krydsangreb). Anonymisering af aggregerede data hvorfor aggregering ikke forhindrer genidentifikation. Forespørgselsauditering. Auditering SUM forespørgsler over reals. Hårdheden af forespørgselsauditering. Forespørgselsforstyrrelse, Differential Privacy. |
20 | Anonym kommunikation | Problemet med anonym kommunikation. Afsender, modtager anonymitet, unlinkability. Anonymisering af proxy. Chaum MIX, mixnet. Tor, illustration af TOR. Kredsløbsopsætning i TOR. Exit-politikker. Nogle angreb på TOR. |
20 | Privatlivets fred i AI | De vigtigste problemer med beskyttelse af privatlivets fred i maskinlæring; medlemskabsslutning, modeludtræk, retfærdighed. Kilde til retfærdighedsproblemer (bias in training data collection/labelling, feature selection, forskellige kulturelle fortolkninger af retfærdighed). Beskyttede attributter. Retfærdighed gennem blindhed, redundante kodninger (proxyattributter). |
5 | Konklusioner | Hvorfor er privatlivets fred vigtigt? Hvorfor er overvågning et problem? Hvorfor har nogen noget at skjule? Hvorfor er privatlivet svært? Hvilke kompetencer har en databeskyttelsesrådgiver? Hvorfor er der behov for databeskyttelsesrådgivere? |
Anerkendelser
Programmet Human-Centered AI Masters blev samfinansieret af Connecting Europe-faciliteten i Den Europæiske Union under tilskud CEF-TC-2020-1 Digital Skills 2020-EU-IA-0068.