Transformer-arkkitehtuuri generatiivisessa tekstinluonnissa

Tolvanen, Annika

Transformer-arkkitehtuuri generatiivisessa tekstinluonnissa

dc.contributor.author	Tolvanen, Annika
dc.contributor.department	fi=Tietotekniikan laitos\|en=Department of Computing\|
dc.contributor.faculty	fi=Teknillinen tiedekunta\|en=Faculty of Technology\|
dc.contributor.studysubject	fi=Tietotekniikka\|en=Information and Communication Technology\|
dc.date.accessioned	2025-04-08T21:30:08Z
dc.date.available	2025-04-08T21:30:08Z
dc.date.issued	2025-03-27
dc.description.abstract	Transformer-arkkitehtuuri on syväoppimisen malli, jota hyödynnetään erityisesti luonnollisen kielen käsittelyssä (engl. Natural Language Processing, NLP). Sen ydin perustuu huomiontimekanismiin, joka mahdollistaa syötteen rinnakkaisen käsittelyn. Toisin kuin perinteiset neuroverkkopohjaiset mallit, jotka käsittelevät syötteen vaiheittain, transformer voi käsitellä laajoja tekstikokonaisuuksia samanaikaisesti. Tämä tekee siitä erityisen hyödyllisen monimutkaisten kielellisten riippuvuuksien hallinnassa ja pitkien tekstien generoinnissa. Tutkielman tavoitteena on tarkastella transformer-arkkitehtuurin keskeisiä ominaisuuksia ja sen roolia generatiivisessa tekstinluonnissa. Erityisesti keskitytään vertailemaan transformer-arkkitehtuuria perinteisiin neuroverkkopohjaisiin malleihin, kuten toistuviin neuroverkkoihin (engl. Recurrent Neural Network, RNN). Lisäksi analysoidaan transformerin etuja ja haasteita erityisesti suomen kielen käsittelyssä, jossa kieliopilliset rakenteet ja pitkät kielelliset riippuvuudet asettavat vaatimuksia kielen mallintamiselle. Osana tutkimusta suoritetaan myös soveltava koe, jossa testataan eri ennakkoon koulutettujen transformer-mallien suorituskykyä suomen kielen käsittelyssä ja tuottamisessa. Kokeen tavoitteena on arvioida mallien kykyä käsitellä suomen kielen erityispiirteitä sekä tuottaa sujuvaa ja kieliopillisesti oikeellista tekstiä. Tutkimuksen tulokset osoittavat transformerin tarjoavan merkittäviä etuja perinteisiin malleihin nähden ja osoittavat sen soveltuvuuden erityisesti monimutkaisten kielellisten tehtävien hallintaan generatiivisessa tekstinluonnissa.
dc.format.extent	46
dc.identifier.olddbid	197405
dc.identifier.oldhandle	10024/180445
dc.identifier.uri	https://www.utupub.fi/handle/11111/3885
dc.identifier.urn	URN:NBN:fi-fe2025040824924
dc.language.iso	fin
dc.rights	fi=Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.\|en=This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.\|
dc.rights.accessrights	suljettu
dc.source.identifier	https://www.utupub.fi/handle/10024/180445
dc.subject	Transformer-arkkitehtuuri, syväoppiminen, kielimalli, huomiointimekanismi, generatiivinen tekstinluonti, luonnollisen kielen käsittely, neuroverkko, RNN
dc.title	Transformer-arkkitehtuuri generatiivisessa tekstinluonnissa
dc.type.ontasot	fi=Kandidaatintutkielma\|en=Bachelor's thesis\|

Tiedostot

Näytetään 1 - 1 / 1

Name:: Tolvanen_Annika_opinnayte.pdf
Size:: 717.64 KB
Format:: Adobe Portable Document Format

Lataa

Kokoelmat

Kandidaatin tutkielmat (rajattu näkyvyys)