Syväoppivat neuroverkot ja niiden sovellukset
Heininen, Sara (2020-11-17)
Syväoppivat neuroverkot ja niiden sovellukset
Heininen, Sara
(17.11.2020)
Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.
avoin
Julkaisun pysyvä osoite on:
https://urn.fi/URN:NBN:fi-fe2020120198991
https://urn.fi/URN:NBN:fi-fe2020120198991
Tiivistelmä
Tämä tutkielma käsittelee syväoppivia neuroverkkoja ja niiden sovelluksia. Tutkielmassa käydään läpi neuroverkkojen perusrakenne ja erilaisia neuroverkkorakenteita, neuroverkon kouluttaminen, syväoppivien neuroverkkojen rakenne ja sovellukset sekä tekoälyn ja koneoppimisen perusteita. Lisäksi esitetään esimerkkiongelma, jossa luokitellaan kuvia neuroverkkojen avulla.
Tutkielman johdannossa annetaan lyhyt yleinen kuvaus neuroverkoista, sekä käydään läpi neuroverkkojen historiaa alkaen McCullochin ja Pittsin neuronimallista ja päättyen 1980-luvulla alkaneen neuroverkkojen modernin kehityksen saavutuksiin. Johdannon lopussa annetaan lyhyt kuvaus alan nykypäivän tilanteesta.
Tutkielman alussa käydään läpi tekoälyn ja koneoppimisen perusteita. Tekoälyä käsittelevässä osiossa luodaan yleinen katsaus tekoälyn määritelmään ja sitä tutkivaan tieteenalaan. Koneoppimisen osalta yleisen katsauksen lisäksi käsitellään valvottua ja valvomatonta oppimista sekä kolmea keskeistä koneoppimisongelmaa: luokittelua, regressiota ja klusterointia.
Seuraavaksi tutkielmassa siirrytään käsittelemään neuroverkkoja. Tässä tutkielmassa keinotekoisiin neuroverkkoihin viitataan yleensä yksinkertaisesti termillä "neuroverkot". Tutkielmassa käydään läpi neuroverkkojen perusteita, ominaisuuksia, rakennetta sekä erilaisia aktivaatiofunktioita. Eri neuroverkkorakenteista käsitellään monikerroksinen perseptroni, takaisinkytketty neuroverkko ja itseorganisoituva kartta. Neuroverkkojen kouluttamiseen liittyen käydään perusperiaatteiden lisäksi läpi gradientin laskeutuminen, vastavirta-algoritmi, koulutus-, testaus- ja arviointiaineisto, sekä ali- ja ylisovittaminen.
Neuroverkkojen jälkeen tutkielmassa siirrytään käsittelemään syväoppivia neuroverkkoja yksityiskohtaisemmin. Yleisen kuvauksen lisäksi syväoppiviin neuroverkkoihin liittyen käsitellään logistista regressiota, syväoppivien neuroverkkojen sovelluksia sekä syväoppivia neuroverkkorakenteita, joista esitellään konvoluutioneuroverkko ja pinotut autoenkooderit.
Tutkielman johdannossa annetaan lyhyt yleinen kuvaus neuroverkoista, sekä käydään läpi neuroverkkojen historiaa alkaen McCullochin ja Pittsin neuronimallista ja päättyen 1980-luvulla alkaneen neuroverkkojen modernin kehityksen saavutuksiin. Johdannon lopussa annetaan lyhyt kuvaus alan nykypäivän tilanteesta.
Tutkielman alussa käydään läpi tekoälyn ja koneoppimisen perusteita. Tekoälyä käsittelevässä osiossa luodaan yleinen katsaus tekoälyn määritelmään ja sitä tutkivaan tieteenalaan. Koneoppimisen osalta yleisen katsauksen lisäksi käsitellään valvottua ja valvomatonta oppimista sekä kolmea keskeistä koneoppimisongelmaa: luokittelua, regressiota ja klusterointia.
Seuraavaksi tutkielmassa siirrytään käsittelemään neuroverkkoja. Tässä tutkielmassa keinotekoisiin neuroverkkoihin viitataan yleensä yksinkertaisesti termillä "neuroverkot". Tutkielmassa käydään läpi neuroverkkojen perusteita, ominaisuuksia, rakennetta sekä erilaisia aktivaatiofunktioita. Eri neuroverkkorakenteista käsitellään monikerroksinen perseptroni, takaisinkytketty neuroverkko ja itseorganisoituva kartta. Neuroverkkojen kouluttamiseen liittyen käydään perusperiaatteiden lisäksi läpi gradientin laskeutuminen, vastavirta-algoritmi, koulutus-, testaus- ja arviointiaineisto, sekä ali- ja ylisovittaminen.
Neuroverkkojen jälkeen tutkielmassa siirrytään käsittelemään syväoppivia neuroverkkoja yksityiskohtaisemmin. Yleisen kuvauksen lisäksi syväoppiviin neuroverkkoihin liittyen käsitellään logistista regressiota, syväoppivien neuroverkkojen sovelluksia sekä syväoppivia neuroverkkorakenteita, joista esitellään konvoluutioneuroverkko ja pinotut autoenkooderit.