Suuret kielimallit lääketieteellisten lausuntojen rakenteellistamisessa
1.04 MB
avoin
Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.
Lataukset150
Pysyvä osoite
Verkkojulkaisu
DOI
Tiivistelmä
Tutkielma käsittelee lääketieteellisten lausuntojen rakenteellistamista suurten kielimallien avulla sekä teoriassa että käytännössä. Rakenteellistaminen on luonnollisen kielen käsittelyn tehtävä, josta voidaan myös käyttää nimitystä tiedonpoimintatehtävä. Tutkielmassa esitellään luonnollisen kielen käsittelyn perusperiaatteita ja tämän jälkeen erityisesti tiedonpoimintatehtävien piirteitä ja niiden erilaisia ratkaisutapoja. Koska tässä tutkielmassa ratkaistaan lääketieteen alan tutkimuskysymys, käsitellään tutkielmassa myös luonnollisen kielen erityispiirteitä lääketieteellisessä esimerkkisovelluskohteessa.
Tutkielmassa esitellään suurten kielimallien kehitystä ja historiaa, niiden rakennetta ja eri ominaisuuksien merkitystä suurten kielimallien toiminnassa. Tämän tutkielman implementointiosuudessa hyödynnetään kehotesuunnittelua. Tämän takia esitellään myös sen perusajatus ja juuri tämän tutkielman implementointiosuudessa hyödyllisiä tekniikoita. Lopuksi huomioidaan vielä suurten kielimallien haasteet, sekä käyttäjän näkökulmasta että yhteiskunnallisella tasolla.
Tutkielman implementointiosuudessa tarkastellaan neljän suuren kielimallin (GPT-3.5, GPT-4, Llama3-70b ja Gemini1.0-pro-001) suoritusta lääketieteellisten lausuntojen rakenteellistamisessa. Päähuomio on mallien suoritusten toistettavuudessa, oikeellisuudessa ja kehotteiden vaikutuksessa mallien toimintaan. Lopuksi esitellään tutkielmassa saadut tulokset ja esitetään joitakin mallikohtaisia kehotesuunnitteluehdotuksia mallien suoritusten parantamiseksi.