Katsaus Big data –käsitteisiin ja -tekniikoihin

dc.contributorMatemaattis-luonnontieteellinen tiedekunta / Faculty of Mathematics and Natural Sciences, Tulevaisuuden teknologioiden laitos, Tietojenkäsittelytiede-
dc.contributor.authorSaarinen, Leena
dc.contributor.departmentfi=Tulevaisuuden teknologioiden laitos|en=Department of Future Technologies|
dc.contributor.facultyfi=Matemaattis-luonnontieteellinen tiedekunta|en=Faculty of Mathematics and Natural Sciences|-
dc.contributor.studysubjectfi=Tietojenkäsittelytiede|en=Computer Science|
dc.date.accessioned2017-08-15T09:31:03Z
dc.date.available2017-08-15T09:31:03Z
dc.date.issued2017-08-15
dc.description.abstractTiedon määrä maailmassa kasvaa nopeasti. Tietoa on periaatteessa aina ollut saatavilla, mutta vasta viime vuosikymmenen aikana digitalisoitumisen myötä se on saatu talteen ja laajassa mitassa käyttöön. Big data on sekä käsitteellinen että tekninen vallankumous. Informaatiosta on tullut laite-/dataohjattua eli tieto prosessoidaan ja analysoidaan automaattisesti. Big data ei syrjäytä tai korvaa tavallista dataa, mutta sen olemassaolo tulisi huomioida. Kaikilla aloilla joudutaan varautumaan massiivisten tietomäärien käsittelyyn ja analysointiin. Sitä varten tarvitaan uusia täydellisesti kuvattuja ja hyvin organisoituja tietosäiliöitä. Niiden suunnittelussa metadataan ja identifiointijärjestelmään tulee kiinnittää erityistä huomiota. Analysointimenetelmät ovat vanhoja ja löytyvät eri tieteenaloilta, esim. luokittelu, ryvästys, tiedonlouhinta, assosiaatiosäännöt, koneoppiminen, hahmon tunnistus, visualisointi, tekstianalytiikka. Tekniikat valitaan tapauskohtaisesti, sillä Big data -aineistot ovat kaikki erilaisia. Valtavien tietomäärien prosessointiin ja säilyttämiseen tarvitaan uudenlaista tekniikkaa. Hadoop on avoimen lähdekoodin alusta, jonka ytimen muodostavat hajautettu tiedostojärjestelmä ja rinnakkaisprosessointia tukeva ohjelmointimalli. Hadoop on erittäin vikasietoinen ja helposti skaalautuva.-
dc.description.notificationSiirretty Doriasta
dc.format.contentabstractOnly
dc.identifier.olddbid160203
dc.identifier.oldhandle10024/143668
dc.identifier.urihttps://www.utupub.fi/handle/11111/8815
dc.language.isofin-
dc.publisherfi=Turun yliopisto|en=University of Turku|
dc.source.identifierhttps://www.utupub.fi/handle/10024/143668
dc.titleKatsaus Big data –käsitteisiin ja -tekniikoihin-

Tiedostot