Prednáška: Ladenie hyperparametrov

Administratívne informácie

Názov	Ladenie hyperparametrov
Trvanie	60
Modul	B
Druh lekcie	Prednáška
Zameranie	Technické – hĺbkové učenie
Téma	Ladenie hyperparametrov

Kľúčové slová

Ladenie hyperparametrov, aktivačné funkcie, strata, epochy, veľkosť dávky,

Vzdelávacie ciele

Preskúmať účinky na kapacitu a hĺbku
Skúsenosti s rôznymi epochami a veľkosťami šarží
Skúšanie rôznych aktivačných funkcií a miery učenia

Očakávaná príprava

Naučte sa udalosti, ktoré treba dokončiť predtým

Povinné pre študentov

Žiadne.

Voliteľné pre študentov

Žiadne.

Referencie a zázemie pre študentov

John D Kelleher a Brain McNamee (2018), Základy strojového učenia pre prediktívnu dátovú analytiku, MIT Press.
Michael Nielsen. (2015), Neural Networks and Deep Learning (Neurálne siete a hlboké učenie), 1. Kľúčové slová, San Francisco CA USA.
Charu C. Aggarwal. (2018), Neural Networks and Deep Learning (Neurálne siete a hlboké učenie), 1. Springer
Antonio Gulli, Sujit Pal. Hlboké učenie s Keras, Packt, [ISBN: 9781787128422].

Odporúčané pre učiteľov

Žiadne.

Učebné materiály

Pokyny pre učiteľov

Táto prednáška predstaví študentom základy ladenia hyperparametrov. Ako príklady použitia a výsledkov ladenia rôznych hypermetrov použijeme súbor údajov o sčítaní. Súbor údajov o sčítaní dospelých je binárny problém klasifikácie. Viac o tomto súbore údajov v príslušnom tutoriálu. Cieľom tejto prednášky je predstaviť niekoľko hyperparametrov s príkladmi, ako môže úprava týchto hyperparametrov pomôcť alebo brániť učeniu. Okrem toho poskytujeme príklady pod a nadmernej montáže, nosa a výkonu (čas tréningu a v niektorých prípadoch presnosť/strata), keď sú všetky hyperparametre vyladené. Použijeme diagnostické grafy na vyhodnotenie účinku tunningu hyperparametra a najmä zameranie na stratu, kde je potrebné poznamenať, že modul, ktorý používame na vykreslenie straty, je matplotlib.pyplot, takže os je zmenšená. To môže znamenať, že významné rozdiely sa pri porovnávaní straty tréningových alebo testovacích údajov môžu javiť ako nevýznamné alebo naopak. Okrem toho sú prezentované niektoré slobody lešenia, ako napríklad použitie Epochov ako prvé (takmer ako technika regularizácie) pri zachovaní konštantnej veľkosti dávky. V ideálnom prípade by boli spolu vyladené, ale pre túto prednášku sú oddelené.

Obrysy

Časový harmonogram
Trvanie (Min)	Popis
5	Prehľad údajov
10	Kapacita a hĺbkové ladenie (pod a cez montáž)
10	Epochy (pod a cez odbornú prípravu)
10	Veľkosti šarží (pre potlačenie hluku)
10	Aktivačné funkcie (a ich vplyv na výkon – čas a presnosť)
10	Miera vzdelania (vanilla, LR Decay, Momentum, Adaptive)
5	Rekapitulácia na proces odovzdávania dopredu

Uznania

Program Masters umelej inteligencie zameraný na človeka bol spolufinancovaný z Nástroja Európskej únie na prepájanie Európy v rámci grantu CEF-TC-2020 – 1 Digitálne zručnosti 2020-EU-IA-0068.

Plán vyučovania na SURF

Stránka Wikiwijs