[αυτή η σελίδα στο wiki][δείκτης][EN][BG][CS][DA][DE][EL][ES][ET][FI][FR][GA][HR][HU][IT][MT][NL][PL][PT][RO][SK][SL][SV]

Πρακτικό: Πλαίσια ελέγχου της ιδιωτικής ζωής και της προστασίας των δεδομένων

Διοικητικές πληροφορίες

Τίτλος Εισαγωγικές επιθέσεις συμμετοχής και απόδοσης στα μοντέλα μηχανικής μάθησης
Διάρκεια 90 λεπτά
Ενότητα Β
Είδος μαθήματος Πρακτική
Εστίαση Ηθική — Αξιόπιστη ΤΝ
Θέμα Επιθέσεις απορρήτου στη μηχανική μάθηση

Λέξεις-κλειδιά

Έλεγχος, Απόρρητο της Μηχανικής Μάθησης, Εξεταστική Εισαγωγής Μελών, Δοκιμή Εισαγωγής Χαρακτηριστικών,

Μαθησιακοί στόχοι

Αναμενόμενη προετοιμασία

Υποχρεωτικό για τους φοιτητές

  • Πύθων
  • Scikit
  • Πάντα
  • ΤΈΧΝΗ
  • εικονικός-env
  • Επιθέσεις μελών
  • Συμπέρασμα χαρακτηριστικού
  • ΑΞΙΟΛΟΓΗΣΗ ΥΠΟΔΕΙΓ

Προαιρετικό για Φοιτητές

Καμία.

Υλικό μαθήματος

Οδηγίες για τους εκπαιδευτικούς

Αυτή η εργαστηριακή άσκηση στοχεύει στην ανάπτυξη των πρακτικών δεξιοτήτων των μαθητών στον έλεγχο των εγγυήσεων απορρήτου των μοντέλων Μηχανικής Μάθησης. Οι μαθητές θα πρέπει να κατανοήσουν ότι οι επιθέσεις μελών υποθέτουν τη γνώση του δείγματος-στόχου που πρέπει να δοκιμαστεί, κάτι που δεν είναι πάντα εφικτό. Ωστόσο, η επιτυχία του συμπεράσματος μελών μπορεί να προβλέψει σοβαρότερες διαρροές ιδιωτικότητας στο μέλλον.

Τα μοντέλα μηχανικής μάθησης συχνά εκπαιδεύονται σε εμπιστευτικά (ή προσωπικά, ευαίσθητα) δεδομένα. Για παράδειγμα, ένα τέτοιο μοντέλο μπορεί να προβλέψει τον μισθό ενός ατόμου από τα άλλα χαρακτηριστικά του (όπως η εκπαίδευση, ο χώρος διαβίωσης, η φυλή, το φύλο κ.λπ.). Μια κοινή παρανόηση είναι ότι τα μοντέλα αυτά δεν θεωρούνται δεδομένα προσωπικού χαρακτήρα ακόμη και αν τα δεδομένα εκπαίδευσής τους είναι προσωπικά (πράγματι, τα δεδομένα κατάρτισης μπορούν να είναι η συλλογή αρχείων σχετικά με άτομα), καθώς υπολογίζονται από συγκεντρωτικές πληροφορίες που προέρχονται από τα ευαίσθητα δεδομένα κατάρτισης (π.χ. μέσος όρος κλίσεων σε νευρωνικά δίκτυα ή εντροπία/αριθμός ετικετών σε τυχαία δάση). Στόχος αυτού του εργαστηρίου είναι να δείξει ότι τα μοντέλα μηχανικής μάθησης μπορούν να θεωρηθούν προσωπικά δεδομένα και, ως εκ τούτου, η επεξεργασία τους είναι πολύ πιθανό να ρυθμιστεί σε πολλές χώρες (π.χ. από τον ΓΚΠΔ στην Ευρώπη). Οι μαθητές θα σχεδιάσουν επιθέσεις απορρήτου για να δοκιμάσουν εάν τα εκπαιδευμένα μοντέλα διαρρέουν πληροφορίες σχετικά με τα δεδομένα εκπαίδευσης, καθώς και να μετριάσουν αυτές τις επιθέσεις. Για παράδειγμα, οι επιθέσεις συμπεράσματος μελών αποσκοπούν στον εντοπισμό της παρουσίας ενός δεδομένου δείγματος στα δεδομένα εκπαίδευσης ενός μοντέλου-στόχου από τα μοντέλα ή/και την παραγωγή του. Οι επιθέσεις White-box μπορούν να έχουν πρόσβαση τόσο στα εκπαιδευμένα μοντέλα (συμπεριλαμβανομένων των παραμέτρων του) όσο και στην έξοδο του μοντέλου (δηλαδή, τις προβλέψεις του), ενώ τα μοντέλα black-box μπορούν να έχουν πρόσβαση μόνο στις προβλέψεις του μοντέλου για ένα δεδομένο δείγμα. Οι επιθέσεις εξαγωγής χαρακτηριστικών στοχεύουν στην πρόβλεψη ενός ευαίσθητου χαρακτηριστικού που λείπει από την έξοδο του μοντέλου μηχανικής μάθησης που εκπαιδεύεται καθώς και όλων των άλλων χαρακτηριστικών.

Μια επακόλουθη εκδήλωση μάθησης αφορά τον μετριασμό αυτών των απειλών: Πρακτικό: Εφαρμογή και αξιολόγηση τεχνικών διατήρησης της ιδιωτικής ζωής

Σχεδιάγραμμα

Σε αυτή την εργαστηριακή συνεδρία, θα μετρήσετε τους κινδύνους για την προστασία της ιδιωτικής ζωής για μοντέλα τεχνητής νοημοσύνης και θα μετριάζετε επίσης τις επιθέσεις. Συγκεκριμένα, οι μαθητές θα

  1. εκπαιδεύστε ένα μοντέλο μηχανικής μάθησης (Random Forest) στο σύνολο δεδομένων ενηλίκων για να προβλέψετε το χαρακτηριστικό δυαδικού εισοδήματος στο σύνολο δεδομένων
  2. μέτρηση των κινδύνων για την προστασία της ιδιωτικής ζωής με την έναρξη μιας επίθεσης μέλους στο εκπαιδευμένο μοντέλο για να ελέγξετε αν η παρουσία οποιουδήποτε ατόμου στα δεδομένα εκπαίδευσης μπορεί να ανιχνευθεί μόνο από την πρόβλεψη του μοντέλου (επίθεση μαύρου κουτιού)
  3. εξαγωγική επίθεση χαρακτηριστικού εκτόξευσης στο εκπαιδευμένο μοντέλο για να ελέγξετε αν το ελλείπον (ευαίσθητο) χαρακτηριστικό μπορεί να συναχθεί από ορισμένα βοηθητικά δεδομένα που μοιάζουν με τα αρχικά δεδομένα και την έξοδο του εκπαιδευμένου μοντέλου (επίθεση μαύρου κουτιού)

Οι μαθητές θα σχηματίσουν ομάδες των δύο και θα εργαστούν ως ομάδα. Μία ομάδα πρέπει να υποβάλει μόνο μία τεκμηρίωση/λύση.

Αναγνωρίσεις

Το πρόγραμμα Μάστερ τεχνητής νοημοσύνης με επίκεντρο τον άνθρωπο συγχρηματοδοτήθηκε από τον μηχανισμό «Συνδέοντας την Ευρώπη» της Ευρωπαϊκής Ένωσης στο πλαίσιο της επιχορήγησης CEF-TC-2020-1 Digital Skills 2020-EU-IA-0068.