Tutkimus ChatGPT:llä luotujen käännösten laadusta

Heikkilä, Josefiina

Tutkimus ChatGPT:llä luotujen käännösten laadusta

dc.contributor.author	Heikkilä, Josefiina
dc.contributor.department	fi=Tietotekniikan laitos\|en=Department of Computing\|
dc.contributor.faculty	fi=Teknillinen tiedekunta\|en=Faculty of Technology\|
dc.contributor.studysubject	fi=Tietojenkäsittelytieteet\|en=Computer Science\|
dc.date.accessioned	2024-06-14T21:30:21Z
dc.date.available	2024-06-14T21:30:21Z
dc.date.issued	2024-06-10
dc.description.abstract	Tekoälyohjelmistot ovat kehittyneet paljon viime vuosien aikana. Myös niiden käyttö on yleistynyt niin yrityksissä kuin yksityisihmisillä. Suomen kielellä uusia malleja on tutkittu verrattain vähän, vaikka laajan käytön vuoksi on tärkeää ymmärtää, mihin tekoäly pystyy ja mitkä ovat sen heikkoudet. Tässä tutkielmassa tutkitaan, miten suosioon noussut ChatGPT onnistuu kääntämisessä englanti-suomi-kieliparilla. ChatGPT hyödyntää GPT-3.5-kielimallia, joka on koulutettu vastaamaan käyttäjän antamaan kehotteeseen. GPT-kielimalli on arkkitehtuuriltaan transformer ja hyödyntää itsehuomiomekanismia. Tämä mahdollistaa esimerkiksi tekstissä kaukana toisistaan olevien osien välisten riippuvuuksien huomioimisen. Kääntämisessä itsehuomiomekanismi voi parantaa käännöksen laatua, koska konteksti huomioidaan. Tutkimuksen käännösaineistoksi on kerätty 20 uutisartikkelia: 10 suomenkielistä ja 10 englanninkielistä. Uutisartikkelit syötetään ChatGPT:lle kerran ja kehotteessa pyydetään ohjelmistoa tuottamaan käännös. Tämän jälkeen tuotetut käännökset pisteytetään käyttäen MQM-pisteytysmenetelmää. MQM-menetelmässä virheet jaetaan tyypeittäin ja vakavuusasteittain. Jaottelun avulla niille lasketaan numeerinen virhearvo. Mitä suurempi tai vakavampi virhe, sitä suurempi on virheen virhearvo. Tuotetuista käännöksistä käy ilmi, että ChatGPT tekee käännöksissään toistuvia virheitä. Yleisimpiä virhetyyppejä ovat suorat sanasta sanaan käännökset. Virheet johtavat epäidiomaattisiin ilmauksiin, jotka vaikeuttavat tekstin ymmärtämistä. Virheitä tapahtuu enemmän käännettäessä englannista suomeksi. Kummankaan kielen käännöksiä ei voisi käyttää ilman ihmisen tekemiä muokkauksia. Käännöksiä voisi kuitenkin hyödyntää alustavan käännösversion luomiseen tai saadakseen yleiskuvan tekstistä.
dc.format.extent	44
dc.identifier.olddbid	195421
dc.identifier.oldhandle	10024/178474
dc.identifier.uri	https://www.utupub.fi/handle/11111/1883
dc.identifier.urn	URN:NBN:fi-fe2024061452800
dc.language.iso	fin
dc.rights	fi=Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.\|en=This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.\|
dc.rights.accessrights	avoin
dc.source.identifier	https://www.utupub.fi/handle/10024/178474
dc.subject	ChatGPT, transformer-arkkitehtuuri, konekääntäminen, MQM
dc.title	Tutkimus ChatGPT:llä luotujen käännösten laadusta
dc.type.ontasot	fi=Kandidaatintutkielma\|en=Bachelor's thesis\|

Tiedostot

Näytetään 1 - 1 / 1

Name:: HeikkilaJosefiinaLuKTutkielma2024.pdf
Size:: 788.09 KB
Format:: Adobe Portable Document Format

Lataa

Kokoelmat

Kandidaatin tutkielmat (kokotekstit)