Konvoluutioneuroverkkojen rakenne ja sovelluksia
Sarikka, Teemu (2025-04-19)
Konvoluutioneuroverkkojen rakenne ja sovelluksia
Sarikka, Teemu
(19.04.2025)
Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.
avoin
Julkaisun pysyvä osoite on:
https://urn.fi/URN:NBN:fi-fe2025042932706
https://urn.fi/URN:NBN:fi-fe2025042932706
Tiivistelmä
Tekoäly jaetaan usein kahteen erilaiseen tekoälyn muotoon, heikkoon tekoälyyn ja vahvaan tekoälyyn. Heikkoa tekoälyä ovat sellaiset tekoälyn muodot, joissa tekoäly pyrkii ratkaisemaan jotain yksittäistä ongelmaa ja kaikki tämänhetkiset tekoälytratkaisut ovat heikkoa tekoälyä. Vahvalla tekoälyllä tarkoitetaan sellaisia tekoälyn muotoja, joissa tekoäly pystyy suorittamaan minkä tahansa sellaisen älyllisen tehtävän, jonka ihminenkin pystyy suorittamaan.
Koneoppiminen on tekoälyn osa-alue, jossa pyritään kehittämään tilastollisia menetelmiä, joiden avulla tietokoneohjelma voidaan opettaa suorittamaan tehtäviä perustuen ohjelman saamaan aiempaan dataan. Koneoppimisalgoritmit luokitellaan yleisesti niille annettavan syötetiedon sisältämien ominaisuuksien sekä niistä saatavien tulosteiden luonteen perusteelle ohjatun oppimisen, ohjaamattoman oppimisen, osittain ohjatun oppimisen sekä vahvistusoppimisen algoritmeihin.
Syväoppiminen puolestaan on koneoppimisen osa-alue, jossa käsitellään joukkoa sellaisia koneoppimismenetelmiä, joissa hyödynnetään monikerroksisia neuroverkkoja. Monikerroksiset neuroverkot ovat nimensä mukaisesti neuroverkkoja, jotka koostuvat useista peräkkäisistä kerroksista toisiinsa yhdistettyjä keinotekoisia neuroneita. Syväoppivista neuroverkoista on kehitetty useita toisistaan rakenteellisesti erovia versioita, joilla on keskenään erilaisia etuja ja niitä käytetään erilaisiin sovelluskohteisiin. Yleisimpiä ja tunnetuimpia syväoppivia neuroverkkoja ovat eteenpäin kytketyt neuroverkot, takaisinkytketyt neuroverkot, konvoluutioneuroverkot sekä modernit transformer-arkkitehtuuriin perustuvat neuroverkot.
Tässä tutkielmassa käsitellään syväoppivia- ja erityisesti konvoluutioneuroverkkoja, niiden rakennetta ja sovelluksia. Tutkielmassa käydään läpi tekoälyn, koneoppimisen ja syväoppimisen perusteita, neuroverkkojen perusrakennetta ja neuroverkkojen kouluttamista. Tutkielmassa keskitytään hieman perusteellisemmin käsittelemään konvoluutioneuroverkkojen rakennetta ja lisäksi tutkielmassa käydään läpi esimerkki, jossa datajoukon luokitteluun rakennetaan konvoluutioneuroverkkomalli, monikerrosperseptroni sekä lisäksi datajoukon avulla koulutetaan logistinen regressioluokittelija ja XGBoost -malli, joiden tuottamia datan ennustetarkkuuksia verrataan koulutettujen syväoppimismallien ennustetarkkuuksiin.
Koneoppiminen on tekoälyn osa-alue, jossa pyritään kehittämään tilastollisia menetelmiä, joiden avulla tietokoneohjelma voidaan opettaa suorittamaan tehtäviä perustuen ohjelman saamaan aiempaan dataan. Koneoppimisalgoritmit luokitellaan yleisesti niille annettavan syötetiedon sisältämien ominaisuuksien sekä niistä saatavien tulosteiden luonteen perusteelle ohjatun oppimisen, ohjaamattoman oppimisen, osittain ohjatun oppimisen sekä vahvistusoppimisen algoritmeihin.
Syväoppiminen puolestaan on koneoppimisen osa-alue, jossa käsitellään joukkoa sellaisia koneoppimismenetelmiä, joissa hyödynnetään monikerroksisia neuroverkkoja. Monikerroksiset neuroverkot ovat nimensä mukaisesti neuroverkkoja, jotka koostuvat useista peräkkäisistä kerroksista toisiinsa yhdistettyjä keinotekoisia neuroneita. Syväoppivista neuroverkoista on kehitetty useita toisistaan rakenteellisesti erovia versioita, joilla on keskenään erilaisia etuja ja niitä käytetään erilaisiin sovelluskohteisiin. Yleisimpiä ja tunnetuimpia syväoppivia neuroverkkoja ovat eteenpäin kytketyt neuroverkot, takaisinkytketyt neuroverkot, konvoluutioneuroverkot sekä modernit transformer-arkkitehtuuriin perustuvat neuroverkot.
Tässä tutkielmassa käsitellään syväoppivia- ja erityisesti konvoluutioneuroverkkoja, niiden rakennetta ja sovelluksia. Tutkielmassa käydään läpi tekoälyn, koneoppimisen ja syväoppimisen perusteita, neuroverkkojen perusrakennetta ja neuroverkkojen kouluttamista. Tutkielmassa keskitytään hieman perusteellisemmin käsittelemään konvoluutioneuroverkkojen rakennetta ja lisäksi tutkielmassa käydään läpi esimerkki, jossa datajoukon luokitteluun rakennetaan konvoluutioneuroverkkomalli, monikerrosperseptroni sekä lisäksi datajoukon avulla koulutetaan logistinen regressioluokittelija ja XGBoost -malli, joiden tuottamia datan ennustetarkkuuksia verrataan koulutettujen syväoppimismallien ennustetarkkuuksiin.