Transformerit luonnollisen kielen käsittelyssä: koulutus ja sovellukset

dc.contributor.authorOllila, Veera
dc.contributor.departmentfi=Tietotekniikan laitos|en=Department of Computing|
dc.contributor.facultyfi=Teknillinen tiedekunta|en=Faculty of Technology|
dc.contributor.studysubjectfi=Tietotekniikka|en=Information and Communication Technology|
dc.date.accessioned2025-01-20T22:31:48Z
dc.date.available2025-01-20T22:31:48Z
dc.date.issued2025-01-16
dc.description.abstractTämän kandidaatin tutkielman aiheena on transformer-arkkitehtuuriin perustuvat kielimallit, erityisesti niiden toiminta ja rooli luonnollisen kielen käsittelyssä. Tutkielman tarkoituksena on selvittää, miten transformerien ydintekniikat, kuten huomiomekanismit, mahdollistavat tehokkaan tekstin analysoinnin ja tuottamisen. Tutkimus on luonteeltaan teoreettinen ja perustuu merkittävään alan kirjallisuuteen. Pääpaino on transformeriarkkitehtuurissa ja siihen liittyvissä innovaatioissa, sekä myöhemmin kehittyneissä sovelluksissa. Keskeinen havainto on, että transformeriarkkitehtuuri tarjoaa skaalautuvuutta ja monimutkaisten riippuvuuksien mallintamista pitkien tekstien käsittelyssä. Tämä johtuu erityisesti huomiomekanismien kyvystä painottaa merkityksellisiä tekstinosia tehokkaasti. Lisäksi tutkielmassa analysoidaan mallien koulutusprosesseja ja niihin liittyviä haasteita, kuten resurssivaatimuksia ja optimointistrategioita. Päätelmänä todetaan, että transformerit ovat mullistaneet luonnollisen kielen käsittelyn monipuolisuutensa ja suorituskykynsä ansiosta. Samalla korostetaan tarvetta jatkotutkimukselle, joka keskittyy niiden energiatehokkuuden ja eettisten kysymysten, kuten väärinkäyttömahdollisuuksien, parantamiseen.
dc.format.extent27
dc.identifier.olddbid196802
dc.identifier.oldhandle10024/179845
dc.identifier.urihttps://www.utupub.fi/handle/11111/2479
dc.identifier.urnURN:NBN:fi-fe202501205563
dc.language.isofin
dc.rightsfi=Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.|en=This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.|
dc.rights.accessrightsavoin
dc.source.identifierhttps://www.utupub.fi/handle/10024/179845
dc.subjectkielimallit, kielimallien koulutus, transformerit, Crew AI
dc.titleTransformerit luonnollisen kielen käsittelyssä: koulutus ja sovellukset
dc.type.ontasotfi=Kandidaatintutkielma|en=Bachelor's thesis|

Tiedostot

Näytetään 1 - 1 / 1
Ladataan...
Name:
Ollila_Veera_Kandi_2024.pdf
Size:
390.93 KB
Format:
Adobe Portable Document Format