[käesolev lehekülg wikis][indeks][EN][BG][CS][DA][DE][EL][ES][ET][FI][FR][GA][HR][HU][IT][MT][NL][PL][PT][RO][SK][SL][SV]

Loeng: Korduvad närvivõrgud

Haldusteave

Ametinimetus Korduvad närvivõrgud
Kestus 60 minutit
Moodul B
Õppetunni liik Loeng
Keskendumine Tehniline – sügav õpe
Teema Mitu (korduv närvivõrk (RNN), backpropagation through time (BPTT), pikaajaline lühiajaline mälu (LSTM))

Võtmesõnad

Korduvad neurovõrgud (RNN), backpropagation Trough Time (BPTT), pikaajaline lühiajaline mälu (LSTM),

Õpieesmärgid

Eeldatav ettevalmistamine

Õppeüritused, mis tuleb lõpetada enne

Kohustuslik õpilastele

Valikuline õpilastele

Puudub.

Viited ja taust õpilastele

Puudub.

Soovitatav õpetajatele

Puudub.

Õppematerjalid

Juhised õpetajatele

Alguses on soovitatav anda üldine ülevaade järjestikustest andmetest. Siin saate arutada järjestikuste andmete modelleerimise peamisi kallangeid (sealhulgas vastuvõtlik väli, mitmemõõtmelisus ja mitmemõõtmeline olemus).

Hiljem tutvustame kõigepealt RNN-e koos aluspõhimõtetega ja näitame, et RNN-ide treenimine pärast avamist on väga sarnane MLP-de koolitamisega, kuid sisend-, korduv- ja väljundkaalu maatriksid on jagatud.

Tutvustame BPTT (Backpropagation through time) ja lühendatud versiooni.

Järgnevalt arutleme, kuidas kaduv gradient probleem muudab RNN-id ebapraktiliseks.

Kaduva gradienti lahendamiseks tutvustame LSTM-arhitektuuri, millel on sisemine mäluosa (ka mälurakuna), millel ei ole aktivatoiini – nii et kaduvat gradienti siin ei esine. Palun tehke selgeks, et andmed on tõesti kontrolli all.

Loengu lõpuosas näitame, et LSTM-i (ja RNN, tõepoolest) kihte saab üksteise peale virnastada ühe või kahe suunaga. (ühesuunalised ja kahesuunalised võrgud)

Kontuur

Ajakava
Kestus (Min) Kirjeldus
10 Järjestikuste andmete sissetoomine
15 Korduvad närvivõrgud ja Backpropagation läbi aja
5 Kaovad kalded RNN-ides
20 LSTMid
5 Virnastamine RNN/LSTM kihid
5 Järeldused

Tunnustused

Balint Gyires-Tóth (Budapesti Tehnikaülikool)

Inimkeskse tehisintellekti magistriprogrammi kaasfinantseeris Euroopa Liidu Ühendamise Rahastu toetusega CEF-TC-2020–1 „Digioskused 2020“-EU-IA-0068.