Informazioni amministrative
Titolo | Introduzione alla privacy dei dati |
Durata | 135 min |
Modulo | B |
Tipo di lezione | Lezione |
Focus | Etico — AI affidabile |
Argomento | Privacy dei dati |
Parole chiave
Dati Privacy, Privacy Rischio, Dati Personali, Dati Sensibili, Profilazione, Tracking, Anonimizzazione, Privacy in Machine Learning, TOR, Pseudonimizzazione, Identificatori diretti e indiretti,
Obiettivi di apprendimento
- Ottenere una comprensione generale della nozione di privacy.
- Comprendere le difficoltà e le insidie dell'analisi della privacy dei dati e del rilevamento dei dati personali.
- Comprendere il compromesso tra l'anonimizzazione e l'utilità dei dati (nessun pranzo gratuito).
- Comprendere la differenza tra la sicurezza dei dati e la privacy dei dati.
- Imparare i principi di base della comunicazione anonima e TOR.
- Discernere, indagare e discutere i rischi chiave che l'IA e i modelli di Machine Learning introducono
Preparazione prevista
Eventi di apprendimento da completare prima
Obbligatorio per gli studenti
- Algebra lineare di base,
- Apprendimento automatico di base
Facoltativo per gli studenti
Nessuno.
Referenze e background per gli studenti
Consigliato per gli insegnanti
- Regolamento generale sulla protezione dei dati (GDPR)
- Dati personali
- Query Auditing
- TOR
- Tracciamento web
- Esposto! Un'indagine sugli attacchi ai dati privati
- Privacy differenziale
Materiale didattico
Istruzioni per gli insegnanti
Questa lezione fornisce una panoramica della privacy dei dati. Si concentra su diversi problemi di privacy del web tracking, condivisione dei dati e apprendimento automatico, così come alcune tecniche di mitigazione. L'obiettivo è quello di fornire le conoscenze essenziali (tecniche) necessarie per identificare e proteggere i dati personali. Il corso fa luce sul perché ricavare informazioni utili socialmente o individualmente sulle persone è impegnativo senza rivelare informazioni personali. Queste competenze stanno diventando un must di ogni ingegnere di dati/software e responsabile della protezione dei dati che si occupa di dati personali e sensibili, e sono richiesti anche dal Regolamento generale europeo sulla protezione dei dati (GDPR).
Contorno
Durata (min) | Descrizione | Concetti |
---|---|---|
20 | Cos'è la Privacy? | La privacy come diritto fondamentale. Storia o privacy. Importanza della privacy. Illustrazione della perdita di dati; quante persone condividono su di loro, direttamente o indirettamente? Perché la privacy è un problema? Importanza della legislazione e delle soluzioni tecniche (PETS). |
15 | Definizione di dati personali, sensibili, riservati | Definizione e dati personali nel GDPR. Identificativi diretti vs. indiretti. Definizione di identificabilità. Esempi illustrativi. Definizione dei dati sensibili nel GDPR, esempi. Dati personali vs sensibili vs dati riservati. |
20 | Illustrazione di perdita di dati personali: Tracciamento | Scopo del tracciamento. Web tracking, Browser fingerprinting, WiFi tracking, Ultrasuoni tracking, Tracciamento sotterraneo attraverso il sensore barometro, inferenza di posizione dall'utilizzo della batteria, unicità dei dati di posizione |
20 | Profilazione psicologica | Modello oceano. Inferenza dei tratti della personalità OCEAN dai dati personali. Manipolazione attraverso tratti di personalità, annunci politici. Minaccia di profilazione psicologica, sicurezza cognitiva. |
20 | Anonimizzazione | Tipi di dati, tipi diversi richiedono diverse tecniche di anonimizzazione. Pseudo-anonimizzazione, de-anonimizzazione, re-identificazione. Quasi-identificatori, k-anonimità. Generalizzazione, soppressione, raggruppamento come tecniche generali di k-anonimizzazione. Anonimizzazione vs. utilità. Impossibilità di anonimizzazione senza perdita di utilità. Problemi di k-anonimizzazione (conoscenza di base, attacco di intersezione). Anonimizzazione dei dati aggregati; perché l'aggregazione non impedisce la reidentificazione. Query auditing. Auditing SUM query su reals. Durezza dell'auditing delle query. Perturbazione delle query, Privacy differenziale. |
20 | Comunicazione anonima | Problema della comunicazione anonima. Mittente, anonimato del ricevitore, unlinkability. Anonimizzazione del proxy. Chaum MIX, mixnet. Tor, illustrazione di TOR. Configurazione del circuito in TOR. Politiche di uscita. Alcuni attacchi contro TOR. |
20 | Privacy nell'IA | Principali problemi di privacy nell'apprendimento automatico; inferenza di appartenenza, estrazione del modello, correttezza. Fonte di problemi di equità (pazi nella raccolta/etichettatura dei dati di formazione, selezione delle caratteristiche, diverse interpretazioni culturali dell'equità). Attributi protetti. Correttezza attraverso cecità, codifica ridondante (attribuzioni proxy). |
5 | Conclusioni | Perché la privacy è importante? Perché la sorveglianza è un problema? Perché mai qualcuno ha qualcosa da nascondere? Perché la privacy è difficile? Quali competenze ha un responsabile della protezione dei dati? Perché c'è bisogno di responsabili della protezione dei dati? |
Riconoscimenti
Il programma Human-Centered AI Masters è stato co-finanziato dal meccanismo per collegare l'Europa dell'Unione europea nell'ambito della sovvenzione CEF-TC-2020-1 Digital Skills 2020-EU-IA-0068.