Transformer-arkkitehtuuri generatiivisessa tekstinluonnissa
| dc.contributor.author | Tolvanen, Annika | |
| dc.contributor.department | fi=Tietotekniikan laitos|en=Department of Computing| | |
| dc.contributor.faculty | fi=Teknillinen tiedekunta|en=Faculty of Technology| | |
| dc.contributor.studysubject | fi=Tietotekniikka|en=Information and Communication Technology| | |
| dc.date.accessioned | 2025-04-08T21:30:08Z | |
| dc.date.available | 2025-04-08T21:30:08Z | |
| dc.date.issued | 2025-03-27 | |
| dc.description.abstract | Transformer-arkkitehtuuri on syväoppimisen malli, jota hyödynnetään erityisesti luonnollisen kielen käsittelyssä (engl. Natural Language Processing, NLP). Sen ydin perustuu huomiontimekanismiin, joka mahdollistaa syötteen rinnakkaisen käsittelyn. Toisin kuin perinteiset neuroverkkopohjaiset mallit, jotka käsittelevät syötteen vaiheittain, transformer voi käsitellä laajoja tekstikokonaisuuksia samanaikaisesti. Tämä tekee siitä erityisen hyödyllisen monimutkaisten kielellisten riippuvuuksien hallinnassa ja pitkien tekstien generoinnissa. Tutkielman tavoitteena on tarkastella transformer-arkkitehtuurin keskeisiä ominaisuuksia ja sen roolia generatiivisessa tekstinluonnissa. Erityisesti keskitytään vertailemaan transformer-arkkitehtuuria perinteisiin neuroverkkopohjaisiin malleihin, kuten toistuviin neuroverkkoihin (engl. Recurrent Neural Network, RNN). Lisäksi analysoidaan transformerin etuja ja haasteita erityisesti suomen kielen käsittelyssä, jossa kieliopilliset rakenteet ja pitkät kielelliset riippuvuudet asettavat vaatimuksia kielen mallintamiselle. Osana tutkimusta suoritetaan myös soveltava koe, jossa testataan eri ennakkoon koulutettujen transformer-mallien suorituskykyä suomen kielen käsittelyssä ja tuottamisessa. Kokeen tavoitteena on arvioida mallien kykyä käsitellä suomen kielen erityispiirteitä sekä tuottaa sujuvaa ja kieliopillisesti oikeellista tekstiä. Tutkimuksen tulokset osoittavat transformerin tarjoavan merkittäviä etuja perinteisiin malleihin nähden ja osoittavat sen soveltuvuuden erityisesti monimutkaisten kielellisten tehtävien hallintaan generatiivisessa tekstinluonnissa. | |
| dc.format.extent | 46 | |
| dc.identifier.olddbid | 197405 | |
| dc.identifier.oldhandle | 10024/180445 | |
| dc.identifier.uri | https://www.utupub.fi/handle/11111/3885 | |
| dc.identifier.urn | URN:NBN:fi-fe2025040824924 | |
| dc.language.iso | fin | |
| dc.rights | fi=Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.|en=This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.| | |
| dc.rights.accessrights | suljettu | |
| dc.source.identifier | https://www.utupub.fi/handle/10024/180445 | |
| dc.subject | Transformer-arkkitehtuuri, syväoppiminen, kielimalli, huomiointimekanismi, generatiivinen tekstinluonti, luonnollisen kielen käsittely, neuroverkko, RNN | |
| dc.title | Transformer-arkkitehtuuri generatiivisessa tekstinluonnissa | |
| dc.type.ontasot | fi=Kandidaatintutkielma|en=Bachelor's thesis| |
Tiedostot
1 - 1 / 1
Ladataan...
- Name:
- Tolvanen_Annika_opinnayte.pdf
- Size:
- 717.64 KB
- Format:
- Adobe Portable Document Format