Διοικητικές πληροφορίες
Τίτλος | Επεξεργασία φυσικής γλώσσας |
Διάρκεια | 60-70 λεπτά |
Ενότητα | Α |
Είδος μαθήματος | Πρακτική |
Εστίαση | Πρακτική — Μοντελοποίηση τεχνητής νοημοσύνης |
Θέμα | Ταξινόμηση κειμένου, ταξινόμηση αισθήματος |
Λέξεις-κλειδιά
Επεξεργασία Φυσικής Γλώσσας,Ακατέργαστος Βαθμολογητής,
Μαθησιακοί στόχοι
- Ο μαθητής θα κατανοήσει τα βασικά των βασικών τεχνικών NLP
- Ο μαθητής εξοικειώνεται με τη χρήση ενός ταξινομητή Naive Bayes
Αναμενόμενη προετοιμασία
Μαθησιακές εκδηλώσεις που πρέπει να ολοκληρωθούν πριν
Καμία.
Υποχρεωτικό για τους φοιτητές
- Βασικός προγραμματισμός Python
- Βασικές στατιστικές
Προαιρετικό για Φοιτητές
Αναφορές και υπόβαθρο για τους μαθητές
- Εργαλειοθήκη φυσικής γλώσσας
- Manning, Prabhakar Raghavan και Hinrich Schütze, Εισαγωγή στην ανάκτηση πληροφοριών, Cambridge University Press. 2008
- Jurafskly D., Martin J.H. — Εισαγωγή στο NLP, Υπολογιστική Γλωσσολογία και Αναγνώριση Ομιλίας
Συνιστάται για εκπαιδευτικούς
- Εργαλειοθήκη φυσικής γλώσσας
- Manning, Prabhakar Raghavan και Hinrich Schütze, Εισαγωγή στην ανάκτηση πληροφοριών, Cambridge University Press. 2008
- Jurafskly D., Martin J.H. — Εισαγωγή στο NLP, Υπολογιστική Γλωσσολογία και Αναγνώριση Ομιλίας
Υλικό μαθήματος
Οδηγίες για τους εκπαιδευτικούς
Αυτή η μαθησιακή εκδήλωση αποτελείται από εργαστηριακές εργασίες που θα επιλυθούν από τους μαθητές με τη βοήθεια του κορυφαίου εκπαιδευτή.
Σχεδιάγραμμα
Διάρκεια (ελάχιστη) | Περιγραφή | Έννοιες | Δραστηριότητα | Υλικό |
---|---|---|---|---|
5 | Λέξη Tokenization | |||
5-10 | Pandas DataFrames | |||
10 | Τσάντα των λέξεων | |||
10 | Tokenization με μια τακτική έκφραση | |||
10 | N-gram Μοντέλα | |||
5 | Λέξεις-κλειδιά | |||
10-15 | Ομαλοποίηση, Stemming και Lemmatization | |||
5-10 | Ανάλυση συναισθημάτων |
Αναγνωρίσεις
Το πρόγραμμα Μάστερ τεχνητής νοημοσύνης με επίκεντρο τον άνθρωπο συγχρηματοδοτήθηκε από τον μηχανισμό «Συνδέοντας την Ευρώπη» της Ευρωπαϊκής Ένωσης στο πλαίσιο της επιχορήγησης CEF-TC-2020-1 Digital Skills 2020-EU-IA-0068.