SAC-strategian käyttö ryhmitellyn suuren datan analyysissa

dc.contributor.authorLehto, Matleena
dc.contributor.departmentfi=Matematiikan ja tilastotieteen laitos|en=Department of Mathematics and Statistics|
dc.contributor.facultyfi=Matemaattis-luonnontieteellinen tiedekunta|en=Faculty of Science|
dc.contributor.studysubjectfi=Tilastotiede|en=Statistics|
dc.date.accessioned2026-02-11T22:31:03Z
dc.date.available2026-02-11T22:31:03Z
dc.date.issued2026-02-04
dc.description.abstractTämän tutkielman tavoitteena on tarkastella funktionaalisen ohjelmoinnin käyttöä tilastollisessa data-analyysissa, erityisesti jaa–sovita–yhdistä (eng. split–apply–combine) -strategian näkökulmasta. Funktionaalinen ohjelmointi on ohjelmointiparadigma, jossa ohjelmat rakentuvat funktioiden yhdistämisestä ja se tuottaa toistettavaa, puhdasta ja luotettavaa koodia. R-kielessä paradigmaa tukevat sisäänrakennetut funktiot, kuten apply, lapply ja tapply sekä laajemmat työkalut dplyr- ja purrr-paketit. Tutkielman empiirisessä osassa sovelletaan split-apply-combine -strategiaa NBA:n viralliselta sivustolta ladattuun aineistoon, joka käsittelee 572 pelaajan dataa eli pisteitä, pelattuja minuutteja ja pelaajien ikää kaudelta 2023-2024. Analyysissa aineisto jaetaan joukkueittain, minkä jälkeen pelaajakohtaisia tilastoja tutkitaan funktionaalisen ohjelmoinnin menetelmillä. Täten havainnollistetaan, kuinka suuret datakokonaisuudet voidaan käsitellä tehokkaasti jakamalla ne ensin osiin (split), toteuttamalla annettu analyysitehtävä funktionaalisesti (apply), ja lopuksi kokoamalla tulokset yhteen (combine).
dc.format.extent23
dc.identifier.olddbid214483
dc.identifier.oldhandle10024/197501
dc.identifier.urihttps://www.utupub.fi/handle/11111/1178
dc.identifier.urnURN:NBN:fi-fe2026021112441
dc.language.isofin
dc.rightsfi=Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.|en=This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.|
dc.rights.accessrightsavoin
dc.source.identifierhttps://www.utupub.fi/handle/10024/197501
dc.subjectfunktionaalinen ohjelmointi, split, apply, combine, R-kieli
dc.titleSAC-strategian käyttö ryhmitellyn suuren datan analyysissa
dc.type.ontasotfi=Kandidaatintutkielma|en=Bachelor's thesis|

Tiedostot

Näytetään 1 - 1 / 1
Ladataan...
Name:
Lehto_Matleena_opinnayte.pdf
Size:
1.16 MB
Format:
Adobe Portable Document Format