Gradienttitehostetut päätöspuut

avoin
Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.
Lataukset687

Verkkojulkaisu

DOI

Tiivistelmä

Tässä Pro Gradu -tutkielmassa esitetään XGBoost -koneoppimisalgoritmi ja sovelletaan sitä autovahinko- ja elinajanodoteaineistoihin. Lisäksi algoritmille tehdään suorituskykytesti asuntomyynti -aineistolla. Algoritmi luokittelee aineiston gradienttitehostetuilla päätöspuilla ja tekee ennusteen tämän perusteella. Tutkielman tavoitteena on selvittää, voiko XGBoost -algoritmia käyttää ennustamiseen. Tutkielmassa käytetään Kagglen ”car insurance claim” ja ”Brooklynhomes2003to2017” -aineistoja sekä WHO:n ”life-expectancy-who” -aineistoa. Kaikki aineistot ovat avoimia ja saatavana Kagglen internetsivuilla. Aineistojen käsittely ja mallin sovitus tehdään Python-ohjelman avulla. Tutkielman perusteella algoritmi soveltuu ennustamiseen tyydyttävällä luotettavuudella. Algoritmin suorituskyky oli erinomainen jopa isolla aineistolla.

item.page.okmtext