Informacje administracyjne
Tytuł | Przygotowanie i eksploracja danych |
Czas trwania | 60 |
Moduł | A |
Rodzaj lekcji | Wykład |
Skupienie | Praktyczne – modelowanie AI |
Temat | Metody przygotowania danych |
Słowa kluczowe
Przygotowanie danych, Czyszczenie danych, Transformacja danych, Normalizacja danych, Integracja danych, Redukcja danych,
Cele w zakresie uczenia się
- Aby móc wybrać najbardziej odpowiednią metodę przygotowania danych w oparciu o przypadek
- przygotowanie danych w praktyce (używanie brakujących wartości, tworzenie nowych funkcji pochodnych)
- Wzbogacanie danych
- Etyczne: anonimizacja i problemy z tym (możliwa identyfikacja w sposób pośredni) – ponownie, powinny być pewne przykłady tam
- Imputacja – wspomnienie, że może wprowadzać stronniczość i że należy o tym pamiętać
- Tworzenie nowych funkcji – utrata właściwej semantyki
- Etyczne: usuwanie stronniczości ze zbioru danych
- Podobieństwa i różnice między doborem danych w statystykach a pozyskiwaniem danych (w tym dużych zbiorów danych) w odniesieniu do ML i AI
Oczekiwane przygotowanie
Wydarzenia edukacyjne, które należy ukończyć przed
Obowiązkowe dla studentów
- NIE DOTYCZY
Opcjonalne dla studentów
- NIE DOTYCZY
Referencje i tło dla studentów
- NIE DOTYCZY
Zalecane dla nauczycieli
Materiały do lekcji
Instrukcje dla nauczycieli
Możesz oprzeć tę klasę wokół slajdów.
Zarys
Czas trwania (min) | Opis | Koncepcje | |
---|---|---|---|
5 | Zarys | Metody przygotowania danych: o co chodzi? | |
5 | Problemy/Przetwarzanie | Jakie problemy mogą mieć dane, czyszczenie, oczyszczanie | |
5 | Przygotowanie danych | Czyszczenie, transformacja, integracja, normalizacja, imputacja, identyfikacja hałasu | |
5 | Szczegółowe przygotowanie danych | Formy przygotowania danych | |
10 | Czyszczenie danych w szczegółach | Naprawianie lub usuwanie nieprawidłowych, uszkodzonych, nieprawidłowo sformatowanych, powielanych lub niekompletnych danych w zbiorze danych | |
10 | Transformacja danych w szczegółach | Konwertowanie danych z jednego formatu na inny, najlepsze praktyki. | |
5 | Normalizacja danych w szczegółach | Najlepsze praktyki normalizacji danych. | |
5 | Integracja danych w szczegółach | Najlepsze praktyki integracji danych. | |
5 | Redukcja danych w szczegółach | Najlepsze praktyki redukcji danych. | |
10 | Przygotowanie danych w praktyce | Filtrowanie, brakujące wartości, duplikaty, | |
5 | Uwagi końcowe | Podkreślając znaczenie przygotowania danych. |
Potwierdzenia
Program Masters zorientowany na człowieka został współfinansowany przez instrument „Łącząc Europę” Unii Europejskiej w ramach grantu CEF-TC-2020-1 Umiejętności cyfrowe 2020-EU-IA-0068.