Automaattinen ohjelmakorjaus suurten kielimallien avulla
Kivelä, Aarni (2025-07-17)
Automaattinen ohjelmakorjaus suurten kielimallien avulla
Kivelä, Aarni
(17.07.2025)
Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.
avoin
Julkaisun pysyvä osoite on:
https://urn.fi/URN:NBN:fi-fe2025072979931
https://urn.fi/URN:NBN:fi-fe2025072979931
Tiivistelmä
Suurten kielimallien (LLM) kehitys on avannut uusia mahdollisuuksia automatisoituun ohjelmakorjaukseen (APR), joka pyrkii tunnistamaan ja korjaamaan ohjelmistovirheitä ilman ihmisen väliintuloa. Erityisesti suurissa ohjelmistoprojekteissa APR voi vähentää huomattavasti virheiden korjaamiseen kuluvaa aikaa ja työtä.
Tämä tutkielma on kirjallisuuskatsaus, jossa analysoidaan viime vuosien merkittävimpiä julkaisuja aiheesta. Tutkielma tarkastelee LLM-pohjaisten APR-menetelmien etuja, rajoituksia ja toimintaperiaatteita verrattuina perinteisiin lähestymistapoihin, kuten symboliseen analyysiin ja geneettisiin algoritmeihin perustuviin APR-menetelmiin. Lisäksi tutkielma tarkastelee APR-prosessin käytettävyyttä reaalimaailman tilanteissa erityisesti LLM-pohjaisten APR-menetelmien näkökulmasta.
Tutkielmassa APR-prosessia käsitellään kahdessa toiminnallisessa päävaiheessa: virheen paikantaminen (FL) ja korjauksen generoiminen (PR). Kumpaankin päävaiheeseen liittyen tarkastellaan keinoja mukauttaa LLM:ien toimintaa APR-prosessiin erilaisten kehotestrategioiden ja LLM:ien hienosäädön avulla.
LLM-pohjaiset APR-menetelmät ovat osoittautuneet selvästi tehokkaammiksi, tarkemmiksi ja sovellettavammiksi kuin perinteiset lähestymistavat. Tutkimuskenttää hallitsevat dekooderiarkkitehtuuriin perustuvat mallit, joiden generatiiviset kyvykkyydet ja yleistämispotentiaali tekevät niistä erityisen soveltuvia ohjelmakorjaukseen. Lisäksi hybridimenetelmät, jotka yhdistävät perinteisiä tekniikoita LLM-pohjaisiin ratkaisuihin, tarjoavat lupaavan suunnan tulevalle tutkimukselle.
Tämä tutkielma on kirjallisuuskatsaus, jossa analysoidaan viime vuosien merkittävimpiä julkaisuja aiheesta. Tutkielma tarkastelee LLM-pohjaisten APR-menetelmien etuja, rajoituksia ja toimintaperiaatteita verrattuina perinteisiin lähestymistapoihin, kuten symboliseen analyysiin ja geneettisiin algoritmeihin perustuviin APR-menetelmiin. Lisäksi tutkielma tarkastelee APR-prosessin käytettävyyttä reaalimaailman tilanteissa erityisesti LLM-pohjaisten APR-menetelmien näkökulmasta.
Tutkielmassa APR-prosessia käsitellään kahdessa toiminnallisessa päävaiheessa: virheen paikantaminen (FL) ja korjauksen generoiminen (PR). Kumpaankin päävaiheeseen liittyen tarkastellaan keinoja mukauttaa LLM:ien toimintaa APR-prosessiin erilaisten kehotestrategioiden ja LLM:ien hienosäädön avulla.
LLM-pohjaiset APR-menetelmät ovat osoittautuneet selvästi tehokkaammiksi, tarkemmiksi ja sovellettavammiksi kuin perinteiset lähestymistavat. Tutkimuskenttää hallitsevat dekooderiarkkitehtuuriin perustuvat mallit, joiden generatiiviset kyvykkyydet ja yleistämispotentiaali tekevät niistä erityisen soveltuvia ohjelmakorjaukseen. Lisäksi hybridimenetelmät, jotka yhdistävät perinteisiä tekniikoita LLM-pohjaisiin ratkaisuihin, tarjoavat lupaavan suunnan tulevalle tutkimukselle.