Synteettinen data terveysdatan yksityisyyshaasteiden ratkaisussa

avoin
Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.
Lataukset4

Verkkojulkaisu

DOI

Tiivistelmä

Tekoälymallit ovat edistäneet terveydenhuoltoa merkittävässä tahdissa, mutta niiden kehityksessä on haastavia esteitä. Terveysdatan jakaminen mallien kouluttamista varten on rajoitettua datan arkaluontoisuuden ja lainsäädännöllisten velvoitteiden takia. Synteettinen data on yksi tutkimuksissa esille noussut menetelmä datan yksityisyyden suojaamiselle. Tutkielmassa tarkastellaan synteettisen datan käyttöä ja generointimenetelmiä terveydenhuollossa, keskittyen erityisesti terveysdatan yksityisyyshaasteisiin. Tutkielma toteutettiin kirjallisuuskatsauksena, jossa aineisto valittiin Web of Science ja ACM tietokantojen vuodesta 2020 eteenpäin julkaistuja tutkimuksia. Tutkielman tavoitteena on selvittää synteettisen datan tämänhetkiset hyödyt, haasteet ja mahdollisuudet lääketieteessä. Tutkielmassa selviää synteettisen datan olevan monipuolisesti käytetty anonymisointimenetelmä, jolla on mahdollisuus helpottaa terveysdatan jakamista organisaatioiden välillä. Synteettisessä datassa on riski henkilötietojen uudelleentunnistuksesta ja yksityisyyttä vahvistavat menetelmät usein heikentävät synteettisen datan laatua huomattavasti. Synteettisen datan generointi- ja arviointimenetelmien jatkotutkimusta tarvitaan.

item.page.okmtext