Gradienttitehostetut päätöspuut
823.19 KB
avoin
Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.
Lataukset687
Pysyvä osoite
Verkkojulkaisu
DOI
Tiivistelmä
Tässä Pro Gradu -tutkielmassa esitetään XGBoost -koneoppimisalgoritmi ja sovelletaan sitä autovahinko- ja elinajanodoteaineistoihin. Lisäksi algoritmille tehdään suorituskykytesti asuntomyynti -aineistolla. Algoritmi luokittelee aineiston gradienttitehostetuilla päätöspuilla ja tekee ennusteen tämän perusteella. Tutkielman tavoitteena on selvittää, voiko XGBoost -algoritmia käyttää ennustamiseen.
Tutkielmassa käytetään Kagglen ”car insurance claim” ja ”Brooklynhomes2003to2017” -aineistoja sekä WHO:n ”life-expectancy-who” -aineistoa. Kaikki aineistot ovat avoimia ja saatavana Kagglen internetsivuilla. Aineistojen käsittely ja mallin sovitus tehdään Python-ohjelman avulla.
Tutkielman perusteella algoritmi soveltuu ennustamiseen tyydyttävällä luotettavuudella. Algoritmin suorituskyky oli erinomainen jopa isolla aineistolla.