Suomenkielisten tarjouspyyntöjen luokittelu luonnollisen kielen prosessoinnin avulla

dc.contributor.authorKorte, Veera
dc.contributor.departmentfi=Matematiikan ja tilastotieteen laitos|en=Department of Mathematics and Statistics|
dc.contributor.facultyfi=Matemaattis-luonnontieteellinen tiedekunta|en=Faculty of Science|
dc.contributor.studysubjectfi=Tilastotiede|en=Statistics|
dc.date.accessioned2022-12-02T22:02:28Z
dc.date.available2022-12-02T22:02:28Z
dc.date.issued2022-11-23
dc.description.abstractTämän tutkielman aiheena on julkisten hankintailmoitusten käsittely tekoälyn avulla. Idea on syntynyt tarpeesta nopeuttaa ilmoitusten käsittelyprosessia, joten ajatuksena on, että tekoäly voisi tuoda lisää tietoa sen suhteen, mitkä ilmoituksista ovat kiinnostavia, ja näin rajata tutkittavaa joukkoa pienemmäksi. Ilmoituksen kiinnostavuus perustuu pääasiassa ilmoituksen tekstiin, joten neuroverkko katsottiin sopivaksi malliksi käsittelemään ilmoituksia. Neuroverkkojen matemaattisen taustan ja teorian lisäksi tutkielmassa perehdytään luonnollisen kielen käsittelyn periaatteisiin, eli miten tekoälylle voidaan välittää tekstiaineistoa sen ymmärtämässä muodossa, ja metodeihin, esimerkiksi sanasäkkiin,joka kuvaa tiettyjen sanojen esiintymismääriä. Luonnollisen kielen käsittelyn teoria koskee pääasiassa englannin kieltä, joten tutkielmassa käydään myös läpi suomen kielen mahdollisia haasteita ja niistä käytyä keskustelua, esimerkiksi aiemmissa progradu -tutkielmissa. Aineisto on peräisin yritykseltä, ja se on vahvasti epätasapainoinen luokkien suhteen, joten tutkielmassa esitellään myös erilaisia tapoja käsitellä vahvasti epätasapainoista aineistoa, esimerkiksi SMOTE-metodi ja aliotanta. Näiden suhteen perehdytään myös siihen, kumpi toimii paremmin tekstiaineiston tapauksessa. Tutkielman pääpaino on kuitenkin tekoälyn ja neuroverkkojen perusteissa. Matemaattisen teorian lisäksi esitellään toimintaperiaate, erilaisia tasoja ja niiden toimintaa ja käyttöä sekä yleisimpiä valintoja esimerkiksi aktivointifunktion suhteen. Tutkielmassa syvennytään erityisesti sellaisiin neuroverkon arkkitehtuureihin, joista on hyötyä tekstiaineiston käsittelyssä, kuten toistuvat ja kiertävät neuroverkot. Tutkielman analyysiosiossa vertaillaan kolmen eri neuroverkon kykyä luokitella hankintailmoituksia kiinnostaviin ja epäkiinnostaviin ja mitä eroja neuroverkkojen päätelmissä on. Lopuksi esitellään ajatuksia siitä, miten tutkielmaa tullaan hyödyntämäänja jatkokehittämään yrityksessä.
dc.format.extent45
dc.identifier.olddbid190418
dc.identifier.oldhandle10024/173509
dc.identifier.urihttps://www.utupub.fi/handle/11111/23879
dc.identifier.urnURN:NBN:fi-fe2022120268807
dc.language.isofin
dc.rightsfi=Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.|en=This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.|
dc.rights.accessrightssuljettu
dc.source.identifierhttps://www.utupub.fi/handle/10024/173509
dc.subjectLuonnollisen kielen käsittely, Neuroverkot, Julkiset hankintailmoitukset
dc.titleSuomenkielisten tarjouspyyntöjen luokittelu luonnollisen kielen prosessoinnin avulla
dc.type.ontasotfi=Pro gradu -tutkielma|en=Master's thesis|

Tiedostot

Näytetään 1 - 1 / 1
Ladataan...
Name:
Korte_Veera_progradu.pdf
Size:
1.33 MB
Format:
Adobe Portable Document Format