Bayesian and Bootstrap Methods for Estimating Population Attributable Risk: Development of an R Package for Epidemiological Inference

dc.contributor.authorSaari, Peppi-Lotta
dc.contributor.departmentfi=Tietotekniikan laitos|en=Department of Computing|
dc.contributor.facultyfi=Teknillinen tiedekunta|en=Faculty of Technology|
dc.contributor.studysubjectfi=Tietojenkäsittelytieteet|en=Computer Science|
dc.date.accessioned2025-06-16T21:04:07Z
dc.date.available2025-06-16T21:04:07Z
dc.date.issued2025-06-09
dc.description.abstractThis thesis explores the calculation of Population Attributable Risk (PAR) and Population Attributable Fraction (PAF), focusing on constructing confidence intervals using both Bayesian and Bootstrap methods. The result is an R package designed for usability, enabling users to compute PAR and PAF from 2x2 contingency tables and construct confidence intervals using either a fully Bayesian approach, as described by Pirikahu et al., or a Bootstrap method. Comparative evaluations show that while Bootstrap generally produces shorter intervals, its performance diminishes in cases of low or high exposure rates or small sample sizes—conditions where the Bayesian method demonstrates more consistent coverage. The package also includes functionality for adjusted PAR calculations, offering a pathway toward more complex exposure scenarios. This thesis emphasizes the importance of transparency, reproducibility, and methodological choice in statistical software development. It also highlights the challenges posed by restricted access to scientific literature and limited ongoing maintenance of statistical packages, advocating for more open and sustainable approaches in research tool development.
dc.description.abstractTässä opinnäytetyössä tarkastellaan väestön riskin (Population Attributable Risk, PAR) ja riskiosuuden (Population Attributable Fraction, PAF) laskemista. Pääpaino on luottamusvälien muodostamisessa käyttäen sekä Bayesilaista että Bootstrap-menetelmää. Työn tuloksena on käytettävyyteen keskittyvä R-paketti, jonka avulla käyttäjät voivat laskea PAR- ja PAF-arvoja 2x2-kontingenssitauluista ja muodostaa niille luottamusvälit joko täysin Bayesilaisen lähestymistavan (Pirikahu et al.) tai Bootstrap-menetelmän avulla. Menetelmien vertailu osoittaa, että vaikka Bootstrap tuottaa yleensä lyhyempiä luottamusvälejä, sen suorituskyky heikkenee tilanteissa, joissa altistumisaste on matala tai korkea tai otoskoko pieni. Näissä olosuhteissa Bayesilainen menetelmä tarjoaa tasaisemman kattavuuden. Pakettiin sisältyy myös alustava toiminnallisuus säädetyn väestön riskin laskemiseksi, tarjoten mahdollisuuden siirtyä monimutkaisempiin altistumisskenaarioihin. Opinnäytetyö korostaa läpinäkyvyyden, toistettavuuden ja menetelmällisen valinnan merkitystä tilastollisen ohjelmistokehityksen kontekstissa. Lisäksi työ tuo esiin haasteita, joita tieteellisen kirjallisuuden rajoitettu saatavuus ja tilastopohjaisten ohjelmistopakettien vähäinen ylläpito aiheuttavat, ja puolustaa avoimempia ja kestävämpiä ratkaisuja tutkimustyökalujen kehittämisessä.
dc.format.extent72
dc.identifier.olddbid199172
dc.identifier.oldhandle10024/182209
dc.identifier.urihttps://www.utupub.fi/handle/11111/20366
dc.identifier.urnURN:NBN:fi-fe2025061669711
dc.language.isoeng
dc.rightsfi=Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.|en=This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.|
dc.rights.accessrightsavoin
dc.source.identifierhttps://www.utupub.fi/handle/10024/182209
dc.subjectPopulation attributable risk (PAR), Population attributable fraction (PAF), Attributable fraction (AF), Confidence interval, Bayesian inference, Bootstrap, R, Programming, 2x2 contingency table, Epidemiology, Statistical modeling, Statistical programming, Väestöattribuoitu riski (PAR), Väestöattribuoitu fraktio (PAF), Attribuoitu fraktio (AF), Luottamusväli, Bayesilainen päättely, Bootstrap, R, Ohjelmointi, 2x2 Ristiintaulukointi, Epidemiologia, Tilastomallinnus, Tilasto-ohjelmointi
dc.titleBayesian and Bootstrap Methods for Estimating Population Attributable Risk: Development of an R Package for Epidemiological Inference
dc.type.ontasotfi=Pro gradu -tutkielma|en=Master's thesis|

Tiedostot

Näytetään 1 - 1 / 1
Ladataan...
Name:
Saari_Peppi-Lotta_thesis.pdf
Size:
510.48 KB
Format:
Adobe Portable Document Format