Información administrativa
Título | Aprendizaje automático confiable |
Duración | 60 min |
Módulo | B |
Tipo de lección | Conferencia |
Enfoque | Ética — IA confiable |
Tema | Problemas de confidencialidad, integridad y disponibilidad en el aprendizaje automático |
Keywords
Confidencialidad, integridad, disponibilidad, envenenamiento, evasión, ejemplos administrativos, ejemplos de esponja, backdoors, evasión de explicabilidad, robustness, Trade-off,
Objetivos de aprendizaje
- Obtenga una visión general de los principales problemas de seguridad del aprendizaje automático
- Comprender los principales problemas de confidencialidad, integridad y disponibilidad del aprendizaje automático
- Distinguir la evasión, el envenenamiento y los ataques por puertas traseras
- Comprender los ataques de envenenamiento con etiquetas limpias
- Obtener la intuición de los ejemplos adversarios y su impacto práctico a través de ejemplos de la vida real
- Demostrar los ataques de disponibilidad mediante ejemplos de esponjas construidas artificialmente
- Comprender la amenaza de evasión de explicabilidad
- Comprensión de la compensación entre la robustez y la calidad del modelo
- Conozca los principios de la auditoría de IA (robustness)
Preparación prevista
Eventos de aprendizaje que se completarán antes
Obligatorio para los estudiantes
- Conceptos básicos en Machine Learning
Opcional para estudiantes
Ninguno.
Referencias y antecedentes para estudiantes
- Seminario web HCAIM sobre el enfoque europeo hacia una IA fiable, segura y confiable (disponible en YouTube)
- Ejemplos contradictorios y entrenamiento adversarial
- Robustness adversarial — Teoría y Práctica
- Ataques de envenenamiento contra máquinas vectoriales de apoyo
- Prácticos ataques de caja negra contra el aprendizaje automático
- Hacia la evaluación de la robustez de las redes neuronales
- Robustez Adversarial Certificada a través de Alisado Aleatorio
- Ejemplos de esponja: Ataques de energía y latencia a las redes neuronales
- Las explicaciones pueden ser manipuladas y la geometría es la culpable
- ¡Ranas envenenadas! Ataques de envenenamiento de etiquetas limpias específicas en redes neuronales
- Análisis Integral de Privacidad del Aprendizaje Profundo
- Privacidad de datos y aprendizaje automático confiable
Recomendado para profesores
Material didáctico
Instrucciones para profesores
Este curso proporciona una visión general de la seguridad de los sistemas de aprendizaje automático. Se centra en ataques que son útiles para auditar los modelos de aprendizaje automático de robustez. Se recomienda a los maestros que utilicen ejemplos de la vida real para demostrar la relevancia práctica de estas vulnerabilidades, especialmente para cuestiones relacionadas con la privacidad cuya relevancia práctica a menudo se debate y se considera un obstáculo para el desarrollo humano. Los estudiantes deben entender que los riesgos de privacidad también pueden ralentizar el progreso (las partes que enfrentan riesgos de confidencialidad pueden ser reacias a compartir sus datos). Los estudiantes pueden comprender los diferentes riesgos de seguridad y privacidad de los modelos de ML y pueden desarrollar aún más habilidades prácticas para auditar modelos de ML en los eventos de aprendizaje práctico relacionados, que son:
- Práctica: Mejora de la seguridad y robustez de ML
- Práctica: Aplicar marcos de auditoría
- Práctica: Aplicación y evaluación de técnicas de preservación de la privacidad
- Práctica: Marcos de auditoría de privacidad y protección de datos
Esquema
Duración (min) | Descripción | Conceptos |
---|---|---|
5 | Tríada de la CIA | CIA (confidencialidad, intergridad, disponibilidad) en Machine Learning |
15 | Confidencialidad | Ataque de membresía, extracción de datos de entrenamiento. El robo de modelos. |
20 | Integridad | Evasión, Envenenamiento (dirigido, no dirigido), Evadir la explicabilidad, Puertas traseras. |
15 | Disponibilidad | Generando ejemplos de esponjas. |
5 | Conclusiones |
Reconocimientos
El programa de maestría en IA centrada en el ser humano fue cofinanciado por el Mecanismo «Conectar Europa» de la Unión Europea en virtud de la subvención «CEF-TC-2020-1 Digital Skills 2020-EU-IA-0068».