Hyppää sisältöön
    • Suomeksi
    • In English
  • Suomeksi
  • In English
  • Kirjaudu
Näytä aineisto 
  •   Etusivu
  • 1. Kirjat ja opinnäytteet
  • Pro gradu -tutkielmat ja diplomityöt sekä syventävien opintojen opinnäytetyöt (rajattu näkyvyys)
  • Näytä aineisto
  •   Etusivu
  • 1. Kirjat ja opinnäytteet
  • Pro gradu -tutkielmat ja diplomityöt sekä syventävien opintojen opinnäytetyöt (rajattu näkyvyys)
  • Näytä aineisto
JavaScript is disabled for your browser. Some features of this site may not work without it.

Tilastollinen validointi kaksijakoisissa verkostoissa

Suominen, Joni (2025-10-20)

Tilastollinen validointi kaksijakoisissa verkostoissa

Suominen, Joni
(20.10.2025)
Katso/Avaa
Suominen_Joni_opinnayte.pdf (1.287Mb)
Lataukset: 

Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.
suljettu
Näytä kaikki kuvailutiedot
Julkaisun pysyvä osoite on:
https://urn.fi/URN:NBN:fi-fe20251117108530
Tiivistelmä
Kaksijakoiset verkostot ovat verkostoja, joissa noodit edustavat kahta eri joukkoa. Toisessa joukossa noodit kuvaavat ryhmiä ja toisessa joukossa ryhmiin kuuluvia jäseniä. Esimerkki kaksijakoisesta verkostosta on tutkimuspaperiverkosto, jossa toisen puolen noodit ovat tieteelliset julkaisut ja toinen puoli niiden kirjoittajat. Mikäli kirjoittajat ovat olleet samassa julkaisussa mukana, he jakavat keskenään ryhmän. Kun kaksijakoinen verkosto projisoidaan kirjoittajien puolelle, muodostuu paperin kirjoittajien välille linkki.
Näissä kaksijakoisen verkoston projisointiverkostoissa on kuitenkin runsaasti kohinaa ja satunnaisesti syntyneitä, tilastollisesti merkityksettömiä linkkejä. Tämän ongelman ratkaisuun käytettiin tässä tutkielmassa kaksijakoisen verkoston tilastollista validointia.
Tilastolliseen validointiin käytettiin metodia, jossa verkosto jaettiin osaverkostoihin, joissa ei-projisoitavan puolen aste oli vakio. Laskimme hypergeometrista todennäköisyysjakaumaa noudattavan todennäköisyyden linkin satunnaisuudelle ja vertasimme sitä verkoston heterogeenisyyden ja usean tilastollisen testauksen huomioivaan nolla- hypoteesiin jokaisessa osaverkostossa. Linkin paino määräytyi sillä, kuinka monessa osaverkostossa linkki validoitiin. Työssä käytettiin kahta tilastollista korjausmenetelmää: joustavampaa FDR-korjausta ja konservatiivisempaa Bonferroni-korjausta.
Tutkielmassa tutkittiin, kuinka paljon tilastollisesti merkityksettömiä linkkejä esiintyy käsittelemättömässä verkostossa, ja miten tilastollinen validointi vaikuttaa verkoston rakenteeseen. Datana käytettiin Physical Review A -lehden julkaisuja vuosilta 1970-2009. Datasta luotiin kaksijakoinen kirjoittaja-paperi-verkosto, joka projisoitiin kirjoittajien puolelle. Tätä projisointia verrattiin tilastollisen validoinnin tuottamaan verkostoihin. Tilastollinen validointi vähensi linkkien määrää merkittävästi: FDR-korjauksella tehty validointi suodatti 81 % alkuperäisen projisoinnin linkeistä, ja Bonferroni- korjauksella tehty validointi 95 %. Tämä osoitti, että alkuperäisen projisoinnin verkoston linkeistä suurin osa oli satunnaisesti muodostuvia ja tilastollisesti merkityksettömiä. Tilastollisen validoinnin myötä verkoston rakenne tiivistyi merkittävästi. Verkostojen yhteisörakennetta mittaava modulaarisuus kasvoi ja klusterointikerroin pieneni. Validoiduista verkostoista määriteltiin myös keskeiset tutkijat noodien keskeisyysmittareiden ja asteen perusteella.
Kokoelmat
  • Pro gradu -tutkielmat ja diplomityöt sekä syventävien opintojen opinnäytetyöt (rajattu näkyvyys) [5289]

Turun yliopiston kirjasto | Turun yliopisto
julkaisut@utu.fi | Tietosuoja | Saavutettavuusseloste
 

 

Tämä kokoelma

JulkaisuajatTekijätNimekkeetAsiasanatTiedekuntaLaitosOppiaineYhteisöt ja kokoelmat

Omat tiedot

Kirjaudu sisäänRekisteröidy

Turun yliopiston kirjasto | Turun yliopisto
julkaisut@utu.fi | Tietosuoja | Saavutettavuusseloste