Pitkä lähimuisti takaisinkytketyissä neuroverkoissa

Kautiala, Ilmari

Pitkä lähimuisti takaisinkytketyissä neuroverkoissa

Kautiala, Ilmari

2022-07-19

Pro gradu -tutkielma

Sovellettu matematiikka

Kautiala_Ilmari_opinnayte.pdf

941.04 KB

suljettu

Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.

Lataukset14

Pysyvä osoite

https://urn.fi/URN:NBN:fi-fe2022080452850

Tiivistelmä

Tässä työssä esitellään neuroverkkoarkkitehtuuri pitkä lähimuisti, jonka tarkoitus on lieventää katoavan gradientin ongelmaa takaisinkytketyissä neuroverkoissa. Neuroverkkojen ymmärtämiseksi on hyvä tietää joitain asioita koneoppimisesta. Aluksi käydään läpi yleisellä tasolla koneoppiminen ja siinä käytettäviä matemaattisia työkaluja. Käydään läpi koneoppimisen osat data, malli ja kustannusfunktio. Malleista otetaan tarkempään käsittelyyn tavallinen neuroverkko ja takaisinkytketty neuroverkko. Takaisinkytkettyjen neuroverkkojen ongelmana on asioiden muistaminen pitkien aikavälien yli. Näytetään, miksi näin tapahtuu, jos gradientti suppenee tai hajaantuu. Tavallisista ja takaisinkytketyistä neuroverkoista tarjotaan numeerinen esimerkki. Pitkän lähimuistin suoritusta vertaillaan muihin arkkitehtuureihin luonnollisen kielen luokittelutehtävässä.

Tietueen kaikki tiedot

Pitkä lähimuisti takaisinkytketyissä neuroverkoissa

Toimittaja(t)

Pysyvä osoite

Verkkojulkaisu

DOI

Tiivistelmä

item.page.okmtext