Informacje administracyjne
Tytuł | Przetwarzanie języka naturalnego |
Czas trwania | 60 – 70 minut |
Moduł | A |
Rodzaj lekcji | Wykład |
Skupienie | Praktyczne – modelowanie AI |
Temat | Metody statystyczne dotyczące NLP i klasyfikacji tekstu |
Słowa kluczowe
NLP, przetwarzanie języka naturalnego, lingwistyka obliczeniowa,
Cele w zakresie uczenia się
- Studenci rozumieją podstawowe pojęcia przetwarzania języka naturalnego
- Uczniowie uczą się przypadków użycia NLP
- Studenci zapoznają się z różnymi narzędziami i koncepcjami NLP
Oczekiwane przygotowanie
Wydarzenia edukacyjne, które należy ukończyć przed
Brak.
Obowiązkowe dla studentów
- Przegląd podstawowych statystyk
Opcjonalne dla studentów
- Przegląd języka programowania Python
Referencje i tło dla studentów
- Etyczne wzornictwo: Najlepsze praktyki etyczne w przetwarzaniu języka naturalnego
- Bishop, Christopher M. (2006). Rozpoznawanie wzorców i uczenie maszynowe
- [https://terpconnect.umd.edu/~kshilton/pdf/VitaketalCSCWpreprint.pdf Poza zasadami Belmont: Wyzwania etyczne, praktyki i przekonania w społeczności zajmującej się badaniem danych online]
- Jurafskly D., Martin J. H. – Wprowadzenie do NLP, lingwistyki obliczeniowej i rozpoznawania mowy
- Christopher D. Manning, Prabhakar Raghavan i Hinrich Schütze, Wprowadzenie do wyszukiwania informacji, Cambridge University Press. 2008.
Zalecane dla nauczycieli
Materiały do lekcji
Instrukcje dla nauczycieli
Możesz oprzeć tę klasę wokół slajdów. Materiał jest sugerowany, ale można go dostosować.
Zarys
Czas trwania (min) | Opis | Koncepcje | Działalność | Materiał |
---|---|---|---|---|
5 | Wprowadzenie do przetwarzania języka naturalnego, celów, metod i wyzwań | językoznawstwo komputerowe, przetwarzanie języka naturalnego | ||
5 | Przetwarzanie tekstu języka naturalnego: Przypadki użycia | korpus, segmentacja, tokenizacja, zgodność | ||
10 | Wyrażenia regularne, Normalizacja tekstu | modelowanie językowe, edytowanie odległości | ||
15 | Modele N-gram | Sekwencje słów jako proces Markowa | ||
5 | Łańcuchowa reguła prawdopodobieństwa | Ogólna reguła dotycząca produktu | ||
10 | Markow i MAximum Prawdopodobieństwo szacunkowe | Łańcuch Markowa – model stochastyczny | ||
5 | Modele językowe oceny | Zakłopotanie | ||
5 | Naiwny klasyfikator Bayesa | Klasyfikatory probabilistyczne | Przygotowanie ćwiczeń laboratoryjnych |
Potwierdzenia
Program Masters zorientowany na człowieka został współfinansowany przez instrument „Łącząc Europę” Unii Europejskiej w ramach grantu CEF-TC-2020-1 Umiejętności cyfrowe 2020-EU-IA-0068.