Tutkimusaineistojen laadun hallinnan tehostaminen ja tietosuojan vahvistaminen epidemiologisessa rekisteritutkimuksessa
Virtanen, Juha-Pekka (2017-03-08)
Tutkimusaineistojen laadun hallinnan tehostaminen ja tietosuojan vahvistaminen epidemiologisessa rekisteritutkimuksessa
Virtanen, Juha-Pekka
(08.03.2017)
Tätä artikkelia/julkaisua ei ole tallennettu UTUPubiin. Julkaisun tiedoissa voi kuitenkin olla linkki toisaalle tallennettuun artikkeliin / julkaisuun.
Turun yliopisto
Kuvaus
Siirretty Doriasta
Tiivistelmä
Epidemiologinen rekisteritutkimus pyrkii löytämään sairauksien esiintymiseen johtavia syitä hallinnollisten rekisteriaineistojen avulla. Tutkimusaineiston laadunhallinta antaa rekisteritutkimuksessa pohjan tulosten oikeellisuudelle. Laadunhallinnan tärkeä apuväline on ajantasainen muuttujalista, joka antaa yleiskuvan tutkimusaineistosta. Muuttujalistojen luonti sekä päivittäminen manuaalisesti ovat työvaiheita, jotka vievät paljon työaikaa ja ovat alttiita inhimillisille virheille.
Tutkimusaineistojen henkilöiden tietosuojan ylläpitäminen on ensisijaisen tärkeää, jotta rekisteritutkimuksia voidaan jatkaa tulevaisuudessakin. Henkilötunnusta käytetään Suomessa identifioimaan yksittäinen henkilö hallinnollisissa rekistereissä ja sen avulla voidaan yhdistää tutkimushenkilöiden tietoja eri lähteistä. Henkilötunnusten käyttöä pitää aina välttää niissä tutkimuksen vaiheissa, joissa se on mahdollista. Henkilötunnukset voivat olla salatulla levyalueella, mutta niihin oikeutettu henkilö näkee tunnukset selkokielisinä. Tällöin vastuu salasanasta, näytön suojaamisesta ja tietokoneen lukitsemisesta poistuttaessa työpisteeltä jää työntekijälle.
Käytännön sovellutukset tässä diplomityössä toteutetaan Statistical Analysis System -ohjelmistolla, joka on ollut pitkään yksi suosituimmista aineiston käsittelyn ja analysoinnin ohjelmistoista. Työssä kehitetään muuttujalistaus-ohjelma, joka luo kuvailevan taulukon automaattisesti kaiken tyyppisistä rekisteriaineistoista. Taulukkoa voidaan käyttää aineiston oikeellisuuden varmistamiseen ja laadunhallintaprosessien aloittamiseen. Lisäksi tutkijat voivat tarkastaa saatavilla olevat muuttujat ja arvojen laajuudet sekä kokonaismäärät. Muuttujien listaus tehdään heti uuden tutkimusaineiston saavuttua, jotta voidaan tarkastaa aineiston oikeellisuus ja varmistaa salattavan muuttujan täydellinen nimi. Muuttujalista päivitetään salauksen jälkeen sekä aina laadunhallinnallisten muutosten yhteydessä.
Henkilötunnuksen salaukseen toteutetaan ohjelma, jolla voidaan vastaanottaa ja muuntaa rekisteriaineisto salattuun muotoon ilman, että edes aineistoon oikeutettu henkilö näkee selkokielisiä henkilötunnuksia. Ohjelma tarkastaa henkilötunnuksen oikeellisuuden tarkistusmerkin avulla, jonka jälkeen salaus toteutetaan Advanced Encryption Standard -menetelmällä. Tämä menetelmä on tällä hetkellä suosituin ja testatuin vahva salausalgoritmi. Tässä diplomityössä kehitetyt ohjelmat nopeuttavat muutamia usein toistettavia työvaiheita tunneista minuutteihin, vähentävät inhimillisten virheiden mahdollisuutta ja parantavat tietosuojaa entisestään.
Tutkimusaineistojen henkilöiden tietosuojan ylläpitäminen on ensisijaisen tärkeää, jotta rekisteritutkimuksia voidaan jatkaa tulevaisuudessakin. Henkilötunnusta käytetään Suomessa identifioimaan yksittäinen henkilö hallinnollisissa rekistereissä ja sen avulla voidaan yhdistää tutkimushenkilöiden tietoja eri lähteistä. Henkilötunnusten käyttöä pitää aina välttää niissä tutkimuksen vaiheissa, joissa se on mahdollista. Henkilötunnukset voivat olla salatulla levyalueella, mutta niihin oikeutettu henkilö näkee tunnukset selkokielisinä. Tällöin vastuu salasanasta, näytön suojaamisesta ja tietokoneen lukitsemisesta poistuttaessa työpisteeltä jää työntekijälle.
Käytännön sovellutukset tässä diplomityössä toteutetaan Statistical Analysis System -ohjelmistolla, joka on ollut pitkään yksi suosituimmista aineiston käsittelyn ja analysoinnin ohjelmistoista. Työssä kehitetään muuttujalistaus-ohjelma, joka luo kuvailevan taulukon automaattisesti kaiken tyyppisistä rekisteriaineistoista. Taulukkoa voidaan käyttää aineiston oikeellisuuden varmistamiseen ja laadunhallintaprosessien aloittamiseen. Lisäksi tutkijat voivat tarkastaa saatavilla olevat muuttujat ja arvojen laajuudet sekä kokonaismäärät. Muuttujien listaus tehdään heti uuden tutkimusaineiston saavuttua, jotta voidaan tarkastaa aineiston oikeellisuus ja varmistaa salattavan muuttujan täydellinen nimi. Muuttujalista päivitetään salauksen jälkeen sekä aina laadunhallinnallisten muutosten yhteydessä.
Henkilötunnuksen salaukseen toteutetaan ohjelma, jolla voidaan vastaanottaa ja muuntaa rekisteriaineisto salattuun muotoon ilman, että edes aineistoon oikeutettu henkilö näkee selkokielisiä henkilötunnuksia. Ohjelma tarkastaa henkilötunnuksen oikeellisuuden tarkistusmerkin avulla, jonka jälkeen salaus toteutetaan Advanced Encryption Standard -menetelmällä. Tämä menetelmä on tällä hetkellä suosituin ja testatuin vahva salausalgoritmi. Tässä diplomityössä kehitetyt ohjelmat nopeuttavat muutamia usein toistettavia työvaiheita tunneista minuutteihin, vähentävät inhimillisten virheiden mahdollisuutta ja parantavat tietosuojaa entisestään.