Administrativ information
Titel | Introduktion till datasekretess |
Varaktighet | 135 min |
Modul | B |
Typ av lektion | Föreläsning |
Fokus | Etiskt – tillförlitlig AI |
Ämne | Datasekretess |
Nyckelord
Datasekretess, integritetsrisk, personuppgifter, känsliga uppgifter, profilering, spårning, anonymisering, integritet i maskininlärning, TOR, Pseudonymisering, Direkt och indirekt identifierare,
Lärandemål
- Få en allmän förståelse av begreppet integritet.
- Förstå svårigheterna och fallgroparna med datasekretessanalys och upptäckt av personuppgifter.
- Förstå avvägningen mellan anonymisering och dataverktyg (ingen gratis lunch).
- Förstå skillnaden mellan datasäkerhet och datasekretess.
- Lär dig de grundläggande principerna för anonym kommunikation och TOR.
- Urskilja, undersöka och diskutera viktiga risker som AI och maskininlärningsmodeller introducerar
Förväntad förberedelse
Lärande händelser som ska slutföras innan
Obligatoriskt för studenter
- Grundläggande linjär algebra,
- Grundläggande maskininlärning
Valfritt för studenter
Ingen.
Referenser och bakgrund för studenter
Rekommenderas för lärare
Lektionsmaterial
Instruktioner för lärare
Denna föreläsning ger en översikt över datasekretess. Det fokuserar på olika integritetsproblem av webbspårning, datadelning och maskininlärning, samt vissa begränsningstekniker. Syftet är att ge de grundläggande (tekniska) bakgrundskunskaper som behövs för att identifiera och skydda personuppgifter. Kursen belyser varför härleda socialt eller individuellt användbar information om människor är utmanande utan att avslöja personlig information. Dessa färdigheter blir ett måste för alla data-/mjukvaruingenjörer och dataskyddsombud som hanterar personuppgifter och känsliga uppgifter, och krävs också av den europeiska allmänna dataskyddsförordningen (GDPR).
Konturer
Längd (min) | Beskrivning | Begrepp |
---|---|---|
20 | Vad är integritet? | Integritet som en grundläggande rättighet. Historia eller integritet. Vikten av integritet. Illustration av dataläckage. hur mycket folk delar om dem direkt eller indirekt? Varför är integriteten ett problem? Vikten av lagstiftning och tekniska lösningar (PETS). |
15 | Definition av personliga, känsliga, konfidentiella uppgifter | Definition och personuppgifter i GDPR. Direkt vs indirekta identifierare. Definition av identifiabilitet. Illustrativa exempel. Definition av känsliga uppgifter i GDPR, exempel. Personliga vs känsliga vs konfidentiella uppgifter. |
20 | Illustration av personuppgiftsläckage: Spårning | Syftet med spårning. Webbspårning, Webbläsares fingeravtryck, WiFi-spårning, Ultraljudsspårning, Underjordisk spårning genom barometersensor, platsinferens från batterianvändning, unik platsdata |
20 | Psykologisk profilering | Havsmodell. Slutsatsen av OCEAN personlighetsdrag från personuppgifter. Manipulation genom personlighetsdrag, politiska annonser. Hot om psykologisk profilering, kognitiv säkerhet. |
20 | Anonymisering | Olika typer av data kräver olika anonymiseringstekniker. Pseudoanonymisering, avanonymisering, återidentifiering. Kvasi-identifierare, k-anonymitet. Generalisering, undertryckning, klustring som allmänna k-anonymiseringstekniker. Anonymisering vs. nytta. Omöjligt att anonymisera utan förlust av nyttigheter. Problem med k-anonymisering (bakgrundskunskap, korsningsattack). Anonymisering av aggregerade uppgifter. varför aggregering inte hindrar återidentifiering. Frågestundsgranskning. Granska SUMMA frågor över reals. Hårdhet av frågerevision. Frågestörningar, differentiell integritet. |
20 | Anonym kommunikation | Problem med anonym kommunikation. Avsändare, mottagare anonymitet, olänkbarhet. Anonymisera proxy. Chaum MIX, mixnet. Tor, illustration av TOR. Kretskonfiguration i TOR. Exitpolitik. Några attacker mot Tor. |
20 | Integritet inom AI | De viktigaste integritetsproblemen inom maskininlärning. medlemskapsslutsatser, modellutvinning, rättvisa. Källa till rättviseproblem (fakta vid insamling/märkning av uppgifter, urval av funktioner, olika kulturella tolkningar av rättvisa). Skyddade attribut. Rättvisa genom blindhet, redundant kodning (proxy attribut). |
5 | Slutsatser | Varför är privatlivet viktigt? Varför är övervakning ett problem? Varför har någon någonsin något att dölja? Varför är privatlivet svårt? Vilka befogenheter har ett dataskyddsombud? Varför finns det ett behov av dataskyddsombud? |
Erkännanden
Masterprogrammet Human-Centered AI har samfinansierats av Fonden för ett sammanlänkat Europa i Europeiska unionen inom ramen för Grant CEF-TC-2020–1 Digital Skills 2020 EU-IA-0068.