Tilastollinen validointi kaksijakoisissa verkostoissa

dc.contributor.authorSuominen, Joni
dc.contributor.departmentfi=Fysiikan ja tähtitieteen laitos|en=Department of Physics and Astronomy|
dc.contributor.facultyfi=Matemaattis-luonnontieteellinen tiedekunta|en=Faculty of Science|
dc.contributor.studysubjectfi=Fysikaaliset tieteet|en=Physical Sciences|
dc.date.accessioned2025-11-17T22:04:36Z
dc.date.available2025-11-17T22:04:36Z
dc.date.issued2025-10-20
dc.description.abstractKaksijakoiset verkostot ovat verkostoja, joissa noodit edustavat kahta eri joukkoa. Toisessa joukossa noodit kuvaavat ryhmiä ja toisessa joukossa ryhmiin kuuluvia jäseniä. Esimerkki kaksijakoisesta verkostosta on tutkimuspaperiverkosto, jossa toisen puolen noodit ovat tieteelliset julkaisut ja toinen puoli niiden kirjoittajat. Mikäli kirjoittajat ovat olleet samassa julkaisussa mukana, he jakavat keskenään ryhmän. Kun kaksijakoinen verkosto projisoidaan kirjoittajien puolelle, muodostuu paperin kirjoittajien välille linkki. Näissä kaksijakoisen verkoston projisointiverkostoissa on kuitenkin runsaasti kohinaa ja satunnaisesti syntyneitä, tilastollisesti merkityksettömiä linkkejä. Tämän ongelman ratkaisuun käytettiin tässä tutkielmassa kaksijakoisen verkoston tilastollista validointia. Tilastolliseen validointiin käytettiin metodia, jossa verkosto jaettiin osaverkostoihin, joissa ei-projisoitavan puolen aste oli vakio. Laskimme hypergeometrista todennäköisyysjakaumaa noudattavan todennäköisyyden linkin satunnaisuudelle ja vertasimme sitä verkoston heterogeenisyyden ja usean tilastollisen testauksen huomioivaan nolla- hypoteesiin jokaisessa osaverkostossa. Linkin paino määräytyi sillä, kuinka monessa osaverkostossa linkki validoitiin. Työssä käytettiin kahta tilastollista korjausmenetelmää: joustavampaa FDR-korjausta ja konservatiivisempaa Bonferroni-korjausta. Tutkielmassa tutkittiin, kuinka paljon tilastollisesti merkityksettömiä linkkejä esiintyy käsittelemättömässä verkostossa, ja miten tilastollinen validointi vaikuttaa verkoston rakenteeseen. Datana käytettiin Physical Review A -lehden julkaisuja vuosilta 1970-2009. Datasta luotiin kaksijakoinen kirjoittaja-paperi-verkosto, joka projisoitiin kirjoittajien puolelle. Tätä projisointia verrattiin tilastollisen validoinnin tuottamaan verkostoihin. Tilastollinen validointi vähensi linkkien määrää merkittävästi: FDR-korjauksella tehty validointi suodatti 81 % alkuperäisen projisoinnin linkeistä, ja Bonferroni- korjauksella tehty validointi 95 %. Tämä osoitti, että alkuperäisen projisoinnin verkoston linkeistä suurin osa oli satunnaisesti muodostuvia ja tilastollisesti merkityksettömiä. Tilastollisen validoinnin myötä verkoston rakenne tiivistyi merkittävästi. Verkostojen yhteisörakennetta mittaava modulaarisuus kasvoi ja klusterointikerroin pieneni. Validoiduista verkostoista määriteltiin myös keskeiset tutkijat noodien keskeisyysmittareiden ja asteen perusteella.
dc.format.extent38
dc.identifier.olddbid211430
dc.identifier.oldhandle10024/194450
dc.identifier.urihttps://www.utupub.fi/handle/11111/23698
dc.identifier.urnURN:NBN:fi-fe20251117108530
dc.language.isofin
dc.rightsfi=Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.|en=This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.|
dc.rights.accessrightssuljettu
dc.source.identifierhttps://www.utupub.fi/handle/10024/194450
dc.subjectverkosto, kaksijakoinen verkosto, tilastollinen validointi, FDR-korjaus, Bonferroni-korjaus
dc.titleTilastollinen validointi kaksijakoisissa verkostoissa
dc.type.ontasotfi=Pro gradu -tutkielma|en=Master's thesis|

Tiedostot

Näytetään 1 - 1 / 1
Ladataan...
Name:
Suominen_Joni_opinnayte.pdf
Size:
1.29 MB
Format:
Adobe Portable Document Format