Informații administrative
Titlu | Introducere în confidențialitatea datelor |
Durată | 135 min |
Modulul | B |
Tipul lecției | Prelegere |
Focalizare | Etică – IA demnă de încredere |
Subiect | Confidențialitatea datelor |
Cuvinte cheie
Confidențialitatea datelor, riscul de confidențialitate, datele cu caracter personal, datele sensibile, profilarea, urmărirea, anonimizarea, confidențialitatea în învățarea automată, RPT, Pseudonymizarea, identificatorii direcți și indirecți,
Obiective de învățare
- Obțineți o înțelegere generală a noțiunii de confidențialitate.
- Înțelegeți dificultățile și capcanele analizei confidențialității datelor și ale detectării datelor cu caracter personal.
- Înțelegeți compromisul dintre anonimizare și utilitatea datelor (fără prânz gratuit).
- Înțelegeți diferența dintre securitatea datelor și confidențialitatea datelor.
- Aflați principiile de bază ale comunicării anonime și RPT.
- Discerneți, investigați și discutați principalele riscuri pe care IA și modelele de învățare automată le introduc
Pregătirea preconizată
Evenimente de învățare care urmează să fie finalizate înainte
Obligatoriu pentru studenți
- Algebră liniară de bază,
- Învățarea mașinilor de bază
Opțional pentru studenți
Nici unul.
Referințe și context pentru studenți
Recomandat pentru profesori
- Regulamentul general privind protecția datelor (GDPR)
- Date cu caracter personal
- Auditarea interogărilor
- TOR
- Urmărire web
- Expusă! Un studiu al atacurilor asupra datelor private
- Confidențialitate diferențială
Materiale de lecție
Instrucțiuni pentru profesori
Această prelegere oferă o imagine de ansamblu a confidențialității datelor. Acesta se concentrează pe diferite probleme de confidențialitate ale urmăririi web, schimbului de date și învățării automate, precum și pe unele tehnici de atenuare. Scopul este de a oferi cunoștințele esențiale (tehnice) de fond necesare pentru identificarea și protejarea datelor cu caracter personal. Cursul scoate în evidență de ce obținerea de informații utile din punct de vedere social sau individual despre oameni este provocatoare fără a dezvălui informații personale. Aceste competențe devin o necesitate a fiecărui inginer de date/software și responsabil cu protecția datelor care se ocupă de datele cu caracter personal și sensibile și sunt, de asemenea, impuse de Regulamentul general european privind protecția datelor (RGPD).
Contur
Durată (min) | Descriere | Concepte |
---|---|---|
20 | Ce este confidențialitatea? | Intimitatea ca drept fundamental. Istorie sau intimitate. Importanța vieții private. Ilustrarea scurgerilor de date; cât de mult împărtășesc oamenii despre eleselve direct sau indirect? De ce este intimitatea o problemă? Importanța legislației și a soluțiilor tehnice (PETS). |
15 | Definiția datelor personale, sensibile, confidențiale | Definiție și date cu caracter personal în GDPR. Identificatori direcți vs. identificatori indirecți. Definiția identifiabilității. Exemple ilustrative. Definirea datelor sensibile în GDPR, exemple. Date personale vs sensibile vs. confidențialitate. |
20 | Ilustrarea scurgerilor de date cu caracter personal: Urmărire | Scopul urmăririi. Urmărire web, amprentarea browserului, urmărire WiFi, urmărire cu ultrasunete, urmărire subterană prin intermediul senzorului de barometru, inferența locației din utilizarea bateriei, unicitatea datelor de localizare |
20 | Profilare psihologică | Modelul oceanului. Deducția trăsăturilor de personalitate OCEAN din datele cu caracter personal. Manipularea prin trăsături de personalitate, anunțuri politice. Amenințarea profilării psihologice, a securității cognitive. |
20 | Anonimizarea | Tipuri de date, diferite tipuri necesită tehnici de anonimizare diferite. Pseudo-anonimizare, de-anonimizare, re-identificare. Cvasiidentificatori, k-anonimitate. Generalizare, suprimare, grupare ca tehnici generale k-anonimizare. Anonimizare vs. utilitate. Imposibilitatea anonimizării fără pierderi de utilitate. Probleme de k-anonimizare (cunoștințe generale, atac de intersecție). Anonimizarea datelor agregate; de ce agregarea nu împiedică reidentificarea. Auditarea interogărilor. Auditarea interogărilor SUM asupra realilor. Duritatea auditării interogărilor. Perturbarea interogării, confidențialitatea diferențială. |
20 | Comunicare anonimă | Problema comunicării anonime. Expeditor, anonimatul receptorului, nelegabilitatea. Anonimizarea proxy-ului. Chaum MIX, mixnet. Tor, ilustrație a RPT. Configurarea circuitului în TOR. Politicile de ieșire. Unele atacuri împotriva RPT. |
20 | Confidențialitatea în IA | Principalele probleme de confidențialitate în învățarea automată; deducție de membru, extragere de modele, corectitudine. Sursa problemelor legate de echitate (părtini în colectarea/etichetarea datelor de formare, selecția caracteristicilor, diferite interpretări culturale ale echității). Atribute protejate. Corectitudinea prin orbire, codări redundante (atribute proxy). |
5 | Concluzii | De ce contează confidențialitatea? De ce supravegherea este o problemă? De ce are cineva ceva de ascuns? De ce intimitatea este grea? Ce competențe are un responsabil cu protecția datelor? De ce este nevoie de responsabili cu protecția datelor? |
Confirmări
Programul de masterat AI centrat pe om a fost cofinantat de Mecanismul pentru interconectarea Europei al Uniunii Europene sub Grantul CEF-TC-2020-1 Digital Skills 2020-EU-IA-0068.