Административна информация
Дял | Въведение в поверителността на данните |
Продължителност | 135 мин. |
Модул | Б |
Вид на урока | Лекция |
Фокус | Етичен — надежден ИИ |
Тема | Поверителност на данните |
Ключови думи
Поверителност на данните, риск за неприкосновеността на личния живот, лични данни, чувствителни данни, профилиране, проследяване, анонимизация, поверителност в машинното обучение, TOR, Pseudonymization, директни и непреки идентификатори,
Учебни цели
- Получаване на общо разбиране на понятието за неприкосновеност на личния живот.
- Разбиране на трудностите и клопките при анализа на поверителността на данните и откриването на лични данни.
- Разберете компромиса между анонимизирането и полезността на данните (без безплатен обяд).
- Разберете разликата между сигурността на данните и поверителността на данните.
- Научете основните принципи на анонимната комуникация и TOR.
- Разграничаване, проучване и обсъждане на основните рискове, които ИИ и моделите за машинно обучение въвеждат
Очаквана подготовка
Обучение на събития, които трябва да бъдат завършени преди
Задължително за студентите
- Основна линейна алгебра,
- Основно машинно обучение
Незадължително за студенти
Няма.
Референции и фон за студенти
Препоръчва се за учители
- Общ регламент относно защитата на данните (GDPR)
- Лични данни
- Одит на заявки
- ТОР
- Уеб проследяване
- Експониран! Проучване на атаките върху личните данни
- Диференциална поверителност
Материали за уроци
Инструкции за учители
Тази лекция предоставя преглед на поверителността на данните. Тя се фокусира върху различни проблеми с поверителността на уеб проследяването, споделянето на данни и машинното обучение, както и някои техники за смекчаване на последиците. Целта е да се предоставят необходимите (технически) знания, необходими за идентифициране и защита на личните данни. Курсът хвърля светлина върху това защо извличането на социално или индивидуално полезна информация за хората е предизвикателство, без да разкрива лична информация. Тези умения се превръщат в задължителни за всеки инженер на данни/софтуер и длъжностно лице по защита на данните, занимаващо се с лични и чувствителни данни, и се изискват и от Европейския Общ регламент относно защитата на данните (ОРЗД).
Очертаване
Продължителност (мин) | Описание | Концепции |
---|---|---|
20 | Какво представлява поверителността? | Неприкосновеността на личния живот като основно право. История или поверителност. Значението на неприкосновеността на личния живот. Илюстрация на изтичането на данни; колко хора споделят за тяхпряко или индиректно? Защо неприкосновеността на личния живот е проблем? Значение на законодателството и техническите решения (PETS). |
15 | Дефиниция на лични, чувствителни, поверителни данни | Определение и лични данни в GDPR. Директни индиректни идентификатори. Определение за разпознаваемост. Илюстративни примери. Дефиниране на чувствителни данни в GDPR, примери. Лични срещу чувствителни спрямо поверителни данни. |
20 | Илюстрация на изтичането на лични данни: Следене | Цел на проследяването. Уеб проследяване, Браузър пръстови отпечатъци, WiFi проследяване, Ултразвуково проследяване, Подземно проследяване чрез барометър сензор, извод за местоположението от използването на батерията, уникалност на данните за местоположението |
20 | Психологическо профилиране | Модел на океана. Извод за личностните черти на OCEAN от личните данни. Манипулация чрез личностни черти, политически реклами. Заплаха от психологическо профилиране, когнитивна сигурност. |
20 | Анонимизиране | Типовете данни, различните видове се нуждаят от различни техники за анонимизиране. Псевдоанонимизиране, деанонимизиране, повторно идентифициране. Квазиидентификатори, k-анонимност. Обобщаване, потискане, групиране като общи техники за анонимизиране на k. Анонимизация срещу полезност. Невъзможност за анонимизиране без загуба на полезност. Проблеми на k-анонимизацията (фоново знание, атака на пресечната точка). Анонимизиране на обобщените данни; защо агрегирането не пречи на повторното идентифициране. Проверка на заявките. Одитиране на заявки за SUM над реални. Твърдост на одита на заявките. Смущения в заявките, Диференциална поверителност. |
20 | Анонимна комуникация | Проблемът с анонимната комуникация. Изпращач, анонимност на получателя, несвързаност. Анонимизиране на прокси. Chaum MIX, микснет. Tor, илюстрация на TOR. Настройка на веригата в TOR. Политики за излизане. Някои атаки срещу ТСР. |
20 | Неприкосновеността на личния живот в ИИ | Основни проблеми с неприкосновеността на личния живот в машинното обучение; извод за членство, извличане на модел, справедливост. Източник на проблеми със справедливостта (предубеждения при събирането/етикетирането на данни от обучението, подбор на характеристики, различни културни интерпретации на справедливостта). Защитени атрибути. Справедливост чрез слепота, излишни кодировки (прокси атрибути). |
5 | Изводи | Защо неприкосновеността на личния живот има значение? Защо наблюдението е проблем? Защо някой има какво да крие? Защо неприкосновеността на личния живот е трудна? Какви компетенции има длъжностното лице по защита на данните? Защо има нужда от служители по защита на данните? |
Потвърждения
Магистърската програма по ИИ, насочена към човека, беше съфинансирана от Механизма за свързване на Европа на Европейския съюз под формата на безвъзмездни средства № CEF-TC-2020—1 Digital Skills 2020-EU-IA-0068.