[ova stranica na wiki][indeks][EN][BG][CS][DA][DE][EL][ES][ET][FI][FR][GA][HR][HU][IT][MT][NL][PL][PT][RO][SK][SL][SV]

Predavanje: Ugađanje hiperparametra

Administrativne informacije

Naslov Ugađanje hiperparametra
Trajanje 60
Modul B
Vrsta lekcija Predavanje
Fokus Tehničko – dubinsko učenje
Tema Ugađanje hiperparametra

Ključne riječi

Ugađanje hiperparametra, aktivacijske funkcije, gubitak, epohe, veličina serije,

Ciljevi učenja

Očekivana priprema

Obvezno za studente

Nijedan.

Neobvezno za studente

Nijedan.

Preporuke i pozadina za studente

  • John D Kelleher i Brain McNamee. (2018.), Fundamentals of Machine Learning for Predictive Data Analytics (Osnove strojnog učenja za prediktivnu analizu podataka), MIT Press.
  • Michael Nielsen. (2015.), Neuralne mreže i duboko učenje, 1. Resorni tisak, San Francisco CA SAD.
  • Charu C. Aggarwal. (2018.), Neuralne mreže i duboko učenje, 1. Springer
  • Antonio Gulli, Sujit Pal. Dubinsko učenje s Kerasom, Packtom, [ISBN: 9781787128422].

Preporučeno nastavnicima

Nijedan.

Nastavni materijali

Upute za učitelje

Ovo predavanje upoznat će studente s osnovama ugađanja hiperparametra. Upotrijebit ćemo skup podataka popisa kao primjere uporabe i ishoda ugađanja različitih hipermetara. Skup podataka popisa odraslih je binarni klasifikacijski problem. Više o ovom skupu podataka u odgovarajućem vodiču. Cilj ovog predavanja je predstaviti nekoliko hiperparametara s primjerima kako modifikacija ovih hiperparametara može pomoći ili ometati učenje. Osim toga, dajemo primjere nedovoljnih i prenamjena, dobitaka u nosu i performansama (vrijeme treniranja i u nekim slučajevima točnost/gubitak) kada se svaki od hiperparametara ugađa. Upotrijebit ćemo dijagnostičke parcele za procjenu učinka ugađanja hiperparametra, a posebno fokus na gubitak, gdje treba napomenuti da je modul koji koristimo za iscrtavanje gubitka matplotlib.pyplot, tako da je os skalirana. To može značiti da se pri usporedbi gubitka podataka o osposobljavanju ili testu mogu činiti znatne razlike ili obratno. Osim toga, predstavljene su i neke slobode za skele, kao što je prva uporaba epoha (gotovo kao tehnika regularizacije), dok se veličina serije održava konstantnom. U idealnom slučaju, oni će biti ugašeni zajedno, ali za ovo predavanje su razdvojeni.

Nacrt

Hpt.png
Vremenski raspored
Trajanje (min) Opis
5 Pregled podataka
10 Kapacitet i podešavanje dubine (pod i iznad priključka)
10 Epohe (preko osposobljavanja)
10 Veličine serije (za suzbijanje buke)
10 Aktivacijske funkcije (i njihovi učinci na performanse – vrijeme i točnost)
10 Stope učenja (vanilla, LR Decay, Momentum, Adaptive)
5 Preuzmite proces naprijed prolaza

Priznanja

Diplomski studij umjetne inteligencije usmjeren na čovjeka sufinanciran je Instrumentom za povezivanje Europe Europske unije u okviru bespovratnih sredstava CEF-TC-2020 – 1 Digital Skills 2020-EU-IA-0068.