Predavanje: Ugađanje hiperparametra

Administrativne informacije

Naslov	Ugađanje hiperparametra
Trajanje	60
Modul	B
Vrsta lekcija	Predavanje
Fokus	Tehničko – dubinsko učenje
Tema	Ugađanje hiperparametra

Ključne riječi

Ugađanje hiperparametra, aktivacijske funkcije, gubitak, epohe, veličina serije,

Ciljevi učenja

Istražite učinke na kapacitet i dubinu
Iskusan s različitim epohama i veličinama serija
Isprobajte različite funkcije aktivacije i stope učenja

Očekivana priprema

Edukativni događaji koji će biti završeni prije

Obvezno za studente

Nijedan.

Neobvezno za studente

Nijedan.

Preporuke i pozadina za studente

John D Kelleher i Brain McNamee. (2018.), Fundamentals of Machine Learning for Predictive Data Analytics (Osnove strojnog učenja za prediktivnu analizu podataka), MIT Press.
Michael Nielsen. (2015.), Neuralne mreže i duboko učenje, 1. Resorni tisak, San Francisco CA SAD.
Charu C. Aggarwal. (2018.), Neuralne mreže i duboko učenje, 1. Springer
Antonio Gulli, Sujit Pal. Dubinsko učenje s Kerasom, Packtom, [ISBN: 9781787128422].

Preporučeno nastavnicima

Nijedan.

Nastavni materijali

Upute za učitelje

Ovo predavanje upoznat će studente s osnovama ugađanja hiperparametra. Upotrijebit ćemo skup podataka popisa kao primjere uporabe i ishoda ugađanja različitih hipermetara. Skup podataka popisa odraslih je binarni klasifikacijski problem. Više o ovom skupu podataka u odgovarajućem vodiču. Cilj ovog predavanja je predstaviti nekoliko hiperparametara s primjerima kako modifikacija ovih hiperparametara može pomoći ili ometati učenje. Osim toga, dajemo primjere nedovoljnih i prenamjena, dobitaka u nosu i performansama (vrijeme treniranja i u nekim slučajevima točnost/gubitak) kada se svaki od hiperparametara ugađa. Upotrijebit ćemo dijagnostičke parcele za procjenu učinka ugađanja hiperparametra, a posebno fokus na gubitak, gdje treba napomenuti da je modul koji koristimo za iscrtavanje gubitka matplotlib.pyplot, tako da je os skalirana. To može značiti da se pri usporedbi gubitka podataka o osposobljavanju ili testu mogu činiti znatne razlike ili obratno. Osim toga, predstavljene su i neke slobode za skele, kao što je prva uporaba epoha (gotovo kao tehnika regularizacije), dok se veličina serije održava konstantnom. U idealnom slučaju, oni će biti ugašeni zajedno, ali za ovo predavanje su razdvojeni.

Nacrt

Vremenski raspored
Trajanje (min)	Opis
5	Pregled podataka
10	Kapacitet i podešavanje dubine (pod i iznad priključka)
10	Epohe (preko osposobljavanja)
10	Veličine serije (za suzbijanje buke)
10	Aktivacijske funkcije (i njihovi učinci na performanse – vrijeme i točnost)
10	Stope učenja (vanilla, LR Decay, Momentum, Adaptive)
5	Preuzmite proces naprijed prolaza

Priznanja

Diplomski studij umjetne inteligencije usmjeren na čovjeka sufinanciran je Instrumentom za povezivanje Europe Europske unije u okviru bespovratnih sredstava CEF-TC-2020 – 1 Digital Skills 2020-EU-IA-0068.

Nastavni plan o SURF-u

Wikiwijs stranica