Binäärivastemallin arviointi: ROC-käyrät

Kandidaatintutkielma
Ladataan...
suljettu
Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.
Lataukset1

Verkkojulkaisu

DOI

Tiivistelmä

Tutkielmassa tarkastellaan luokittelukykykäyrän (ROC-käyrän) käyttöä mallin arvioimisessa. Käyrä on yleinen arviointityökalu kun puhutaan binäärivastemallin, kuten logistisen regression, suorituskyvyn tulkinnasta. Mallin suorituskyky kuvaa sen tehokkuuta erottaa positiivinen ja negatiivinen luokka. ROC-käyrä on graafinen esitys sensitiivisyydestä ja spesifisyydestä yli kaikkien kynnysarvojen. Käyrä mahdollistaa muun muassa suorituskyvyn arvioimisen, mallien vertailun, optimaalisen kynnysarvon määrittelyn. Tutkielmassa esitellään ROC-käyrän muodostamista, tulkintaa ja muita siihen liittyviä menetelmiä. Tutkielma alkaa lyhyellä logistisen regressionmallin esittelyllä, koska malli toimii havainnollistuskuvien pohjana. Tämän jälkeen käydään läpi tärkeimpiä käsitteitä binäärivastemallin arvioimisessa. Menetelmän esittely osuudessa keskitytään ensin ROC-käyrän muodostukseen. Tässä osuudessa mainitaan muun muassa miten käyrä keskiarvoistetaan ja sekä erotellaan epäparametrinen ja parametrinen ROC-käyrän muodostus. Viimeisessä osuudessa käyrän tulkintaan liittyviä työkaluja kuten käyrän alle jäävä alue (AUC) ja Youden indeksi.

item.page.okmtext