Suuret kielimallit lääketieteellisten lausuntojen rakenteellistamisessa
Kaleva, Ida-Maria (2025-06-19)
Suuret kielimallit lääketieteellisten lausuntojen rakenteellistamisessa
Kaleva, Ida-Maria
(19.06.2025)
Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.
avoin
Julkaisun pysyvä osoite on:
https://urn.fi/URN:NBN:fi-fe2025062674698
https://urn.fi/URN:NBN:fi-fe2025062674698
Tiivistelmä
Tutkielma käsittelee lääketieteellisten lausuntojen rakenteellistamista suurten kielimallien avulla sekä teoriassa että käytännössä. Rakenteellistaminen on luonnollisen kielen käsittelyn tehtävä, josta voidaan myös käyttää nimitystä tiedonpoimintatehtävä. Tutkielmassa esitellään luonnollisen kielen käsittelyn perusperiaatteita ja tämän jälkeen erityisesti tiedonpoimintatehtävien piirteitä ja niiden erilaisia ratkaisutapoja. Koska tässä tutkielmassa ratkaistaan lääketieteen alan tutkimuskysymys, käsitellään tutkielmassa myös luonnollisen kielen erityispiirteitä lääketieteellisessä esimerkkisovelluskohteessa.
Tutkielmassa esitellään suurten kielimallien kehitystä ja historiaa, niiden rakennetta ja eri ominaisuuksien merkitystä suurten kielimallien toiminnassa. Tämän tutkielman implementointiosuudessa hyödynnetään kehotesuunnittelua. Tämän takia esitellään myös sen perusajatus ja juuri tämän tutkielman implementointiosuudessa hyödyllisiä tekniikoita. Lopuksi huomioidaan vielä suurten kielimallien haasteet, sekä käyttäjän näkökulmasta että yhteiskunnallisella tasolla.
Tutkielman implementointiosuudessa tarkastellaan neljän suuren kielimallin (GPT-3.5, GPT-4, Llama3-70b ja Gemini1.0-pro-001) suoritusta lääketieteellisten lausuntojen rakenteellistamisessa. Päähuomio on mallien suoritusten toistettavuudessa, oikeellisuudessa ja kehotteiden vaikutuksessa mallien toimintaan. Lopuksi esitellään tutkielmassa saadut tulokset ja esitetään joitakin mallikohtaisia kehotesuunnitteluehdotuksia mallien suoritusten parantamiseksi.
Tutkielmassa esitellään suurten kielimallien kehitystä ja historiaa, niiden rakennetta ja eri ominaisuuksien merkitystä suurten kielimallien toiminnassa. Tämän tutkielman implementointiosuudessa hyödynnetään kehotesuunnittelua. Tämän takia esitellään myös sen perusajatus ja juuri tämän tutkielman implementointiosuudessa hyödyllisiä tekniikoita. Lopuksi huomioidaan vielä suurten kielimallien haasteet, sekä käyttäjän näkökulmasta että yhteiskunnallisella tasolla.
Tutkielman implementointiosuudessa tarkastellaan neljän suuren kielimallin (GPT-3.5, GPT-4, Llama3-70b ja Gemini1.0-pro-001) suoritusta lääketieteellisten lausuntojen rakenteellistamisessa. Päähuomio on mallien suoritusten toistettavuudessa, oikeellisuudessa ja kehotteiden vaikutuksessa mallien toimintaan. Lopuksi esitellään tutkielmassa saadut tulokset ja esitetään joitakin mallikohtaisia kehotesuunnitteluehdotuksia mallien suoritusten parantamiseksi.