Tutkimus ChatGPT:llä luotujen käännösten laadusta

dc.contributor.authorHeikkilä, Josefiina
dc.contributor.departmentfi=Tietotekniikan laitos|en=Department of Computing|
dc.contributor.facultyfi=Teknillinen tiedekunta|en=Faculty of Technology|
dc.contributor.studysubjectfi=Tietojenkäsittelytieteet|en=Computer Science|
dc.date.accessioned2024-06-14T21:30:21Z
dc.date.available2024-06-14T21:30:21Z
dc.date.issued2024-06-10
dc.description.abstractTekoälyohjelmistot ovat kehittyneet paljon viime vuosien aikana. Myös niiden käyttö on yleistynyt niin yrityksissä kuin yksityisihmisillä. Suomen kielellä uusia malleja on tutkittu verrattain vähän, vaikka laajan käytön vuoksi on tärkeää ymmärtää, mihin tekoäly pystyy ja mitkä ovat sen heikkoudet. Tässä tutkielmassa tutkitaan, miten suosioon noussut ChatGPT onnistuu kääntämisessä englanti-suomi-kieliparilla. ChatGPT hyödyntää GPT-3.5-kielimallia, joka on koulutettu vastaamaan käyttäjän antamaan kehotteeseen. GPT-kielimalli on arkkitehtuuriltaan transformer ja hyödyntää itsehuomiomekanismia. Tämä mahdollistaa esimerkiksi tekstissä kaukana toisistaan olevien osien välisten riippuvuuksien huomioimisen. Kääntämisessä itsehuomiomekanismi voi parantaa käännöksen laatua, koska konteksti huomioidaan. Tutkimuksen käännösaineistoksi on kerätty 20 uutisartikkelia: 10 suomenkielistä ja 10 englanninkielistä. Uutisartikkelit syötetään ChatGPT:lle kerran ja kehotteessa pyydetään ohjelmistoa tuottamaan käännös. Tämän jälkeen tuotetut käännökset pisteytetään käyttäen MQM-pisteytysmenetelmää. MQM-menetelmässä virheet jaetaan tyypeittäin ja vakavuusasteittain. Jaottelun avulla niille lasketaan numeerinen virhearvo. Mitä suurempi tai vakavampi virhe, sitä suurempi on virheen virhearvo. Tuotetuista käännöksistä käy ilmi, että ChatGPT tekee käännöksissään toistuvia virheitä. Yleisimpiä virhetyyppejä ovat suorat sanasta sanaan käännökset. Virheet johtavat epäidiomaattisiin ilmauksiin, jotka vaikeuttavat tekstin ymmärtämistä. Virheitä tapahtuu enemmän käännettäessä englannista suomeksi. Kummankaan kielen käännöksiä ei voisi käyttää ilman ihmisen tekemiä muokkauksia. Käännöksiä voisi kuitenkin hyödyntää alustavan käännösversion luomiseen tai saadakseen yleiskuvan tekstistä.
dc.format.extent44
dc.identifier.olddbid195421
dc.identifier.oldhandle10024/178474
dc.identifier.urihttps://www.utupub.fi/handle/11111/1883
dc.identifier.urnURN:NBN:fi-fe2024061452800
dc.language.isofin
dc.rightsfi=Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.|en=This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.|
dc.rights.accessrightsavoin
dc.source.identifierhttps://www.utupub.fi/handle/10024/178474
dc.subjectChatGPT, transformer-arkkitehtuuri, konekääntäminen, MQM
dc.titleTutkimus ChatGPT:llä luotujen käännösten laadusta
dc.type.ontasotfi=Kandidaatintutkielma|en=Bachelor's thesis|

Tiedostot

Näytetään 1 - 1 / 1
Ladataan...
Name:
HeikkilaJosefiinaLuKTutkielma2024.pdf
Size:
788.09 KB
Format:
Adobe Portable Document Format