Monen selittäjän regressiomenetelmien vertailu: Alzheimerin tautiin liittyvien veren proteiinien yhteys kognitioon

dc.contributor.authorHakala, Jasmine
dc.contributor.departmentfi=Matematiikan ja tilastotieteen laitos|en=Department of Mathematics and Statistics|
dc.contributor.facultyfi=Matemaattis-luonnontieteellinen tiedekunta|en=Faculty of Science|
dc.contributor.studysubjectfi=Tilastotiede|en=Statistics|
dc.date.accessioned2024-06-12T21:02:42Z
dc.date.available2024-06-12T21:02:42Z
dc.date.issued2024-06-03
dc.description.abstractTutkielmassa tarkasteltiin Alzheimerin tautiin liittyvien veren beta-amyloidien 40 (A$\beta40$) ja 42 (A$\beta42$), hapan säikeisen gliaproteiinin (GFAP) sekä neurofilamentin kevytketjun (NfL) pitoisuuksien yhteyttä kognitiotestien tuloksiin terveillä henkilöillä. Yhteyttä tutkittiin vertailemalla erilaisia menetelmiä, jotka sopivat monen selittäjän tilanteeseen. Selittäjinä käytettiin yksittäisten kognitiotestien tuloksia. Menetelmiksi valikoitui osittaisen pienimmän neliösumman regressio, pääkomponentti-, LASSO- ja harjaregressio. Osittaisen pienimmän neliösumman regressio ja pääkomponenttiregressio ovat dimension pienentämismenetelmiä, jotka muodostavat korreloimattomia komponentteja alkuperäisten selittäjien tilalle. Tämä vähentää selittäjien määrää ja pienentää korrelaatiota muuttujien välillä. LASSO- ja harjaregressio kutistavat regressiokertoimien suuruutta kohti nollaa, mikä pienentää kertoimien varianssia ja minimoi ennusteharhaa. Tutkielmassa käytettiin Turun yliopiston Väestötutkimuskeskuksen Lasten Sepelvaltimotaudin Riskitekijät (LASERI) -tutkimuksen vuosina 2018—2020 kerättyä osakohorttia, johon kuului 814 iältään 59--88-vuotiasta henkilöä ($G_0$-sukupolvi) ja 1 237 heidän iältään 41–58-vuotiasta lastaan ($G_1$-sukupolvi). Aineistossa oli kultakin yksilöltä 68 kognitiivisen testin tulosta, verinäytteistä otetut proteiinipitoisuudet sekä taustamuuttujia, kuten sukupuoli, ikä, koulutusvuodet, nukutut tunnit ja vireystila. Kognitiotestien ja proteiinipitoisuuksien yhteyttä tutkittiin $G_0$- ja $G_1$-sukupolvissa sekä yhdessä että erikseen. Tulokset osoittivat heikon yhteyden kognitiotestien ja proteiinien välillä $G_0$-sukupolven aineistossa. Sen sijaan $G_1$-sukupolven aineistossa kognitiotestien arvojen suurentuessa NfL-pitoisuus kasvaa, mutta GFAP-pitoisuus laskee. Koko aineistossa kognitiotestien arvojen kasvaessa NfL- ja GFAP-pitoisuudet kasvavat. Tulokset eivät kuitenkaan ole yksiselitteisiä, koska pääkomponenttien lataukset olivat sekä positiivisia että negatiivisia. Proteiinipitoisuuksien ja iän välinen yhteys oli selkeämpi ja ikääntyessä pitoisuudet kasvavat. Vertailun kohteena olleet menetelmät toimivat toisiinsa nähden yhtä hyvin.
dc.format.extent58
dc.identifier.olddbid195317
dc.identifier.oldhandle10024/178370
dc.identifier.urihttps://www.utupub.fi/handle/11111/19408
dc.identifier.urnURN:NBN:fi-fe2024061250892
dc.language.isofin
dc.rightsfi=Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.|en=This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.|
dc.rights.accessrightsavoin
dc.source.identifierhttps://www.utupub.fi/handle/10024/178370
dc.subjectosittaisen pienimmän neliösumman regressio, pääkomponentti-, harja- ja LASSO-regressio.
dc.titleMonen selittäjän regressiomenetelmien vertailu: Alzheimerin tautiin liittyvien veren proteiinien yhteys kognitioon
dc.type.ontasotfi=Pro gradu -tutkielma|en=Master's thesis|

Tiedostot

Näytetään 1 - 1 / 1
Ladataan...
Name:
Hakala_Jasmine_opinnayte.pdf
Size:
1.11 MB
Format:
Adobe Portable Document Format