Markovin ketju Monte Carlo -menetelmien diagnostiikka
Kaulo, Katja (2025-10-31)
Markovin ketju Monte Carlo -menetelmien diagnostiikka
Kaulo, Katja
(31.10.2025)
Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.
avoin
Julkaisun pysyvä osoite on:
https://urn.fi/URN:NBN:fi-fe20251031104620
https://urn.fi/URN:NBN:fi-fe20251031104620
Tiivistelmä
Markovin ketju Monte Carlo -menetelmillä eli MCMC-menetelmillä simuloidaan näytteitä jakaumasta, ja näin saadaan näytejono, jossa kukin näyte riippuu edellisen näytteen arvosta. Menetelmiä voidaan hyödyntää esimerkiksi Bayes-päättelyssä, kun posteriorijakauma on liian monimutkainen selvittää muilla keinoin. Tarkoituksena on saada aikaan jakauma, joka konvergoi eli suppenee kohti kohdejakaumaa. Konvergenssin saavuttaminen tarkoittaa sitä, että näytteillä kerätty jakauma edustaa kiinnostuksen kohteena olevaa jakaumaa. Tämän onnistumista voidaan selvittää konvergenssidiagnostiikoilla. Diagnostiikkamenetelmistä voidaan mainita esimerkiksi Rˆ-diagnostiikka (eli Gelmanin-Rubinin diagnostiikka), tehollinen otoskoko (ESS) ja jälkikuvio (trace plot).
Tämä tutkielma on muodoltaan kirjallisuuskatsaus. Sen tutkimuskysymyksinä ovat: onko konvergenssidiagnostiikka ratkaistu ongelma ja mitä konvergenssidiagnostiikan kehittelyssä on ajankohtaista 2020-luvulla. Tutkimusaineistona on yhdeksän tutkimusartikkelia.
Tutkimusartikkelien perusteella konvergenssidiagnostiikkoja tutkitaan edelleen eikä kaikkia konvergenssidiagnostiikan ongelmia ole ratkaistu. Viime vuosina on paranneltu aiemmin olemassa olleita menetelmiä, mutta myös kehitelty uusia diagnostiikkoja. Esimerkkinä uudesta menetelmästä, voidaan mainita R∗-diagnostiikka, jossa hyödynnetään koneoppimista. Vakiintuneemmista diagnostiikoista erityisesti Rˆ-diagnostiikkaa tutkitaan edelleen, ja siitä onkin kehitetty lähivuosina uusia versioita kuten folded-split-Rˆ ja nested Rˆ. Rˆ-menetelmän uusien versioiden lisäksi artikkeleissa käsitellään diagnostiikkoja, joita on kehitelty rajatumpiin tilanteisiin kuten bayesiläiseen klusterointiin ja bayesiläisiin hermoverkkoihin. Myös graafisia diagnostiikkoja on kehitelty. On mahdollista, että tulevaisuudessa koneoppimista hyödyntävät menetelmät valtaavat alaa myös konvergenssidiagnostiikoissa.
Tämä tutkielma on muodoltaan kirjallisuuskatsaus. Sen tutkimuskysymyksinä ovat: onko konvergenssidiagnostiikka ratkaistu ongelma ja mitä konvergenssidiagnostiikan kehittelyssä on ajankohtaista 2020-luvulla. Tutkimusaineistona on yhdeksän tutkimusartikkelia.
Tutkimusartikkelien perusteella konvergenssidiagnostiikkoja tutkitaan edelleen eikä kaikkia konvergenssidiagnostiikan ongelmia ole ratkaistu. Viime vuosina on paranneltu aiemmin olemassa olleita menetelmiä, mutta myös kehitelty uusia diagnostiikkoja. Esimerkkinä uudesta menetelmästä, voidaan mainita R∗-diagnostiikka, jossa hyödynnetään koneoppimista. Vakiintuneemmista diagnostiikoista erityisesti Rˆ-diagnostiikkaa tutkitaan edelleen, ja siitä onkin kehitetty lähivuosina uusia versioita kuten folded-split-Rˆ ja nested Rˆ. Rˆ-menetelmän uusien versioiden lisäksi artikkeleissa käsitellään diagnostiikkoja, joita on kehitelty rajatumpiin tilanteisiin kuten bayesiläiseen klusterointiin ja bayesiläisiin hermoverkkoihin. Myös graafisia diagnostiikkoja on kehitelty. On mahdollista, että tulevaisuudessa koneoppimista hyödyntävät menetelmät valtaavat alaa myös konvergenssidiagnostiikoissa.
