Gradienttitehostetut päätöspuut
Korpua, Aleksi (2020-01-31)
Gradienttitehostetut päätöspuut
Korpua, Aleksi
(31.01.2020)
Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.
avoin
Julkaisun pysyvä osoite on:
https://urn.fi/URN:NBN:fi-fe202003128118
https://urn.fi/URN:NBN:fi-fe202003128118
Tiivistelmä
Tässä Pro Gradu -tutkielmassa esitetään XGBoost -koneoppimisalgoritmi ja sovelletaan sitä autovahinko- ja elinajanodoteaineistoihin. Lisäksi algoritmille tehdään suorituskykytesti asuntomyynti -aineistolla. Algoritmi luokittelee aineiston gradienttitehostetuilla päätöspuilla ja tekee ennusteen tämän perusteella. Tutkielman tavoitteena on selvittää, voiko XGBoost -algoritmia käyttää ennustamiseen.
Tutkielmassa käytetään Kagglen ”car insurance claim” ja ”Brooklynhomes2003to2017” -aineistoja sekä WHO:n ”life-expectancy-who” -aineistoa. Kaikki aineistot ovat avoimia ja saatavana Kagglen internetsivuilla. Aineistojen käsittely ja mallin sovitus tehdään Python-ohjelman avulla.
Tutkielman perusteella algoritmi soveltuu ennustamiseen tyydyttävällä luotettavuudella. Algoritmin suorituskyky oli erinomainen jopa isolla aineistolla.
Tutkielmassa käytetään Kagglen ”car insurance claim” ja ”Brooklynhomes2003to2017” -aineistoja sekä WHO:n ”life-expectancy-who” -aineistoa. Kaikki aineistot ovat avoimia ja saatavana Kagglen internetsivuilla. Aineistojen käsittely ja mallin sovitus tehdään Python-ohjelman avulla.
Tutkielman perusteella algoritmi soveltuu ennustamiseen tyydyttävällä luotettavuudella. Algoritmin suorituskyky oli erinomainen jopa isolla aineistolla.