Binäärivastemallin arviointi: ROC-käyrät
Hakula, Maija (2025-05-13)
Binäärivastemallin arviointi: ROC-käyrät
Hakula, Maija
(13.05.2025)
Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.
suljettu
Julkaisun pysyvä osoite on:
https://urn.fi/URN:NBN:fi-fe2025051544982
https://urn.fi/URN:NBN:fi-fe2025051544982
Tiivistelmä
Tutkielmassa tarkastellaan luokittelukykykäyrän (ROC-käyrän) käyttöä mallin arvioimisessa. Käyrä on yleinen arviointityökalu kun puhutaan binäärivastemallin, kuten logistisen regression, suorituskyvyn tulkinnasta. Mallin suorituskyky kuvaa sen tehokkuuta erottaa positiivinen ja negatiivinen luokka. ROC-käyrä on graafinen esitys sensitiivisyydestä ja spesifisyydestä yli kaikkien kynnysarvojen. Käyrä mahdollistaa muun muassa suorituskyvyn arvioimisen, mallien vertailun, optimaalisen kynnysarvon määrittelyn.
Tutkielmassa esitellään ROC-käyrän muodostamista, tulkintaa ja muita siihen liittyviä menetelmiä. Tutkielma alkaa lyhyellä logistisen regressionmallin esittelyllä, koska malli toimii havainnollistuskuvien pohjana. Tämän jälkeen käydään läpi tärkeimpiä käsitteitä binäärivastemallin arvioimisessa. Menetelmän esittely osuudessa keskitytään ensin ROC-käyrän muodostukseen. Tässä osuudessa mainitaan muun muassa miten käyrä keskiarvoistetaan ja sekä erotellaan epäparametrinen ja parametrinen ROC-käyrän muodostus. Viimeisessä osuudessa käyrän tulkintaan liittyviä työkaluja kuten käyrän alle jäävä alue (AUC) ja Youden indeksi.
Tutkielmassa esitellään ROC-käyrän muodostamista, tulkintaa ja muita siihen liittyviä menetelmiä. Tutkielma alkaa lyhyellä logistisen regressionmallin esittelyllä, koska malli toimii havainnollistuskuvien pohjana. Tämän jälkeen käydään läpi tärkeimpiä käsitteitä binäärivastemallin arvioimisessa. Menetelmän esittely osuudessa keskitytään ensin ROC-käyrän muodostukseen. Tässä osuudessa mainitaan muun muassa miten käyrä keskiarvoistetaan ja sekä erotellaan epäparametrinen ja parametrinen ROC-käyrän muodostus. Viimeisessä osuudessa käyrän tulkintaan liittyviä työkaluja kuten käyrän alle jäävä alue (AUC) ja Youden indeksi.