Koneoppimismenetelmien hyödyntäminen IoT-datan poikkeavien arvojen havaitsemiseen

dc.contributor.authorVirtanen, Akseli
dc.contributor.departmentfi=Tietotekniikan laitos|en=Department of Computing|
dc.contributor.facultyfi=Teknillinen tiedekunta|en=Faculty of Technology|
dc.contributor.studysubjectfi=Tietojenkäsittelytieteet|en=Computer Science|
dc.date.accessioned2024-06-11T21:31:33Z
dc.date.available2024-06-11T21:31:33Z
dc.date.issued2024-06-03
dc.description.abstractIoT-laitteiden yleistymisen myötä myös niiden tuottama data on moninkertaistunut. Jotta dataa voidaan hyödyntää, tulee sen tulkitsemisen olla helppoa ja tehokasta. Yksi datan tulkintaan vaikuttavista ongelmista on siinä ilmenevät poikkeavat arvot. Poikkeava arvo on muista havainnoista selkeästi eroava havainto. Tämä ongelma ilmenee etenkin IoT-dataa analysoitaessa, sillä IoT-verkon eri sensorit ovat alttiitta monenlaisille häiriöille, jonka seurauksena syntyy poikkeavia arvoja. Datan määrän kasvun seurauksena perinteiset menetelmät eivät ole riittävän tehokas tapa havaita poikkeavia arvoja. Tästä syystä on kehitetty erilaisia koneoppimismenetelmiä poikkeavien arvojen nopeampaan ja tarkempaan havaitsemiseen. Tutkielma toteutettiin kirjallisuuskatsauksena ja siinä käsitellään koneoppimismenetelmien hyödyntämistä poikkeavien arvojen havaitsemisessa. Tutkielmassa tarkastellaan eri käyttökohteita ja niissä käytettyjä menetelmiä. Lisäksi pyrittiin löytämään syitä käytettyjen menetelmien valintaan. Eri koneoppimismenetelmillä on kaikilla heikkouksia ja vahvuuksia. Koneoppimismenetelmän valintaan vaikuttaa paljon sen käyttökohde. IoT-laitteet ovat yleistyneet etenkin terveyden ja lääketieteen, teollisuuden ja älykotien ja -kaupunkien yhteydessä. Analysoitavan datan tulee olla hyvänlaatuista, joten mahdolliset virheelliset arvot ja viat tulee tunnistaa aikaisin. Koneoppimismenetelmät parantavat suurten datamäärien analysoinnin tehokkuutta ja mahdollistavat monenlaisten eri datatyyppien poikkeavien arvojen löytämisen. Koneoppimismentelemien hyödyntämisen etuna on poikkeavien arvojen ja niihin johtaneiden tapahtumien yhteyden tunnistaminen, sekä mahdollinen käytöksen pitkäaikaisen muutoksen havaitseminen ja uusien kaavojen havaitseminen. Koneoppimismenetelmistä yleisimpiä poikkeavien arvojen havaitsemiseen ovat tukivektorikone ja K:n keskiarvon ryvästys. Eri menetelmien tehokkuuksia vertaillessa tehtävästä riippuen oli paljon vaihtelua menetelmien toimivuudessa, mutta monia menetelmiä yhdistelevät hybridimallit toimivat parhaiten poikkeavuuksien havaitsemisessa. Menetelmien toimivuuteen vaikuttaa paljon käyttökohteen data.
dc.format.extent33
dc.identifier.olddbid195286
dc.identifier.oldhandle10024/178339
dc.identifier.urihttps://www.utupub.fi/handle/11111/2018
dc.identifier.urnURN:NBN:fi-fe2024061150418
dc.language.isofin
dc.rightsfi=Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.|en=This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.|
dc.rights.accessrightsavoin
dc.source.identifierhttps://www.utupub.fi/handle/10024/178339
dc.subjectesineiden internet, poikkeava arvo, koneoppiminen
dc.titleKoneoppimismenetelmien hyödyntäminen IoT-datan poikkeavien arvojen havaitsemiseen
dc.type.ontasotfi=Kandidaatintutkielma|en=Bachelor's thesis|

Tiedostot

Näytetään 1 - 1 / 1
Ladataan...
Name:
Koneoppimismenetelmien%20hy%C3%B6dynt%C3%A4minen%20IoT-datan%20poikkeavien%20arvojen%20havaitsemiseen.pdf
Size:
535.74 KB
Format:
Adobe Portable Document Format