Sakotettujen logististen regressiomenetelmien vertailu
| dc.contributor.author | Reinikainen, Jani | |
| dc.contributor.department | fi=Matematiikan ja tilastotieteen laitos|en=Department of Mathematics and Statistics| | |
| dc.contributor.faculty | fi=Matemaattis-luonnontieteellinen tiedekunta|en=Faculty of Science| | |
| dc.contributor.studysubject | fi=Tilastotiede|en=Statistics| | |
| dc.date.accessioned | 2026-05-04T19:31:27Z | |
| dc.date.issued | 2026-04-23 | |
| dc.description.abstract | Tässä tutkielmassa vertaillaan sakotettujen logististen regressiomenetelmien mukaisia odotettuja ennustevirheitä poikkileikkausaineistoja, joissa vastemuuttujat noudattavat logistista regressiomallia, havaittaessa. Varsinaisille sakotetuille menetelmille vertailukohtana toimivan suurimman uskottavuuden menetelmän lisäksi tarkasteltuja menetelmiä ovat Akaiken informaatiokriteeriin perustuva paras osajoukko ja askeltavat menetelmät, logistinen harju- ja LASSO-regressio sekä sen höllennetty versio. Koska nämä menetelmät olettavat aineiston noudattavan logistista regressiomallia, on ennustevirheeksi valittu Kullback-Leibler-informaatio. Menetelmien puhtaan empiirisen vertailun sijaan niiden mukaisten odotettujen ennustevirheiden vertailu perustetaan KL-informaation odotusarvon asymptoottiseen approksimaatioon. Sen ja informaatioepäyhtälön perusteella suurimman uskottavuuden estimaattorin osoitetaan tuottavan asymptoottisesti pienimmän mahdollisen odotetun ennustevirheen asymptoottisesti normaalien ja harhattomien estimaattorien joukossa parametriavaruuden nollamittaista osaa lukuun ottamatta. Tästä nähdään, että sakotettu estimaattori ei voi kuulua tähän joukkoon ollakseen asymptoottisesti perusteltavissa kaikkialla parametriavaruudessa. Logistisen harjuregression käyttämän sakon todetaan puolestaan olevan luonteeltaan sellaista, että se tuottaa asymptoottisin perustein aina jollain menetelmäparametrin arvolla pienemmän odotetun ennustevirheen kuin suurimman uskottavuuden menetelmä. Koska logistisen LASSO-regression mukainen sakko ei vastaavin perustein samaan kykene, jos kaikille regressiokertoimille estimoidaan aina sama nollasta poikkeava merkki, perustellaan logistisen harjuregression tuottavan muita menetelmiä pienemmän ennustevirheen odotusarvon tällaisia aineistoja havaittaessa. Osana vertailtujen menetelmien mukaisten odotettujen ennustevirheiden asymptoottisten approksimaatioiden muodostamista tässä työssä johdetaan myös logistisen LASSO-regression ja sen höllennetyn version asymptoottiset jakaumat niiden ehdollisia jakaumia ja valintatodennäköisyyksiä hyödyntämällä. Yhdessä niistä simulointiin esitetyn asymptoottisen LARS-algoritmin kanssa nämä tulokset tarjoavat myös mielenkiintoisen ja uuden näkökulman logistisen LASSO-regression mukaiseen odotettuun ennustevirheeseen. | |
| dc.format.extent | 48 | |
| dc.identifier.uri | https://www.utupub.fi/handle/11111/60278 | |
| dc.identifier.urn | URN:NBN:fi-fe2026050437377 | |
| dc.language.iso | fin | |
| dc.rights | fi=Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.|en=This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.| | |
| dc.rights.accessrights | avoin | |
| dc.subject | sakotettu logistinen regressio | |
| dc.subject | informaatioepäyhtälö | |
| dc.subject | KL-informaatio | |
| dc.subject | paras osajoukko | |
| dc.subject | logistinen harju- ja LASSO-regressio | |
| dc.subject | höllennetty LASSO | |
| dc.title | Sakotettujen logististen regressiomenetelmien vertailu | |
| dc.type.ontasot | fi=Pro gradu -tutkielma|en=Master's thesis| |
Tiedostot
1 - 1 / 1
Ladataan...
- Name:
- Sakotettujen logististen regressiomenetelmien vertailu.pdf
- Size:
- 1.41 MB
- Format:
- Adobe Portable Document Format