Suomenkielisten tarjouspyyntöjen luokittelu luonnollisen kielen prosessoinnin avulla
| dc.contributor.author | Korte, Veera | |
| dc.contributor.department | fi=Matematiikan ja tilastotieteen laitos|en=Department of Mathematics and Statistics| | |
| dc.contributor.faculty | fi=Matemaattis-luonnontieteellinen tiedekunta|en=Faculty of Science| | |
| dc.contributor.studysubject | fi=Tilastotiede|en=Statistics| | |
| dc.date.accessioned | 2022-12-02T22:02:28Z | |
| dc.date.available | 2022-12-02T22:02:28Z | |
| dc.date.issued | 2022-11-23 | |
| dc.description.abstract | Tämän tutkielman aiheena on julkisten hankintailmoitusten käsittely tekoälyn avulla. Idea on syntynyt tarpeesta nopeuttaa ilmoitusten käsittelyprosessia, joten ajatuksena on, että tekoäly voisi tuoda lisää tietoa sen suhteen, mitkä ilmoituksista ovat kiinnostavia, ja näin rajata tutkittavaa joukkoa pienemmäksi. Ilmoituksen kiinnostavuus perustuu pääasiassa ilmoituksen tekstiin, joten neuroverkko katsottiin sopivaksi malliksi käsittelemään ilmoituksia. Neuroverkkojen matemaattisen taustan ja teorian lisäksi tutkielmassa perehdytään luonnollisen kielen käsittelyn periaatteisiin, eli miten tekoälylle voidaan välittää tekstiaineistoa sen ymmärtämässä muodossa, ja metodeihin, esimerkiksi sanasäkkiin,joka kuvaa tiettyjen sanojen esiintymismääriä. Luonnollisen kielen käsittelyn teoria koskee pääasiassa englannin kieltä, joten tutkielmassa käydään myös läpi suomen kielen mahdollisia haasteita ja niistä käytyä keskustelua, esimerkiksi aiemmissa progradu -tutkielmissa. Aineisto on peräisin yritykseltä, ja se on vahvasti epätasapainoinen luokkien suhteen, joten tutkielmassa esitellään myös erilaisia tapoja käsitellä vahvasti epätasapainoista aineistoa, esimerkiksi SMOTE-metodi ja aliotanta. Näiden suhteen perehdytään myös siihen, kumpi toimii paremmin tekstiaineiston tapauksessa. Tutkielman pääpaino on kuitenkin tekoälyn ja neuroverkkojen perusteissa. Matemaattisen teorian lisäksi esitellään toimintaperiaate, erilaisia tasoja ja niiden toimintaa ja käyttöä sekä yleisimpiä valintoja esimerkiksi aktivointifunktion suhteen. Tutkielmassa syvennytään erityisesti sellaisiin neuroverkon arkkitehtuureihin, joista on hyötyä tekstiaineiston käsittelyssä, kuten toistuvat ja kiertävät neuroverkot. Tutkielman analyysiosiossa vertaillaan kolmen eri neuroverkon kykyä luokitella hankintailmoituksia kiinnostaviin ja epäkiinnostaviin ja mitä eroja neuroverkkojen päätelmissä on. Lopuksi esitellään ajatuksia siitä, miten tutkielmaa tullaan hyödyntämäänja jatkokehittämään yrityksessä. | |
| dc.format.extent | 45 | |
| dc.identifier.olddbid | 190418 | |
| dc.identifier.oldhandle | 10024/173509 | |
| dc.identifier.uri | https://www.utupub.fi/handle/11111/23879 | |
| dc.identifier.urn | URN:NBN:fi-fe2022120268807 | |
| dc.language.iso | fin | |
| dc.rights | fi=Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.|en=This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.| | |
| dc.rights.accessrights | suljettu | |
| dc.source.identifier | https://www.utupub.fi/handle/10024/173509 | |
| dc.subject | Luonnollisen kielen käsittely, Neuroverkot, Julkiset hankintailmoitukset | |
| dc.title | Suomenkielisten tarjouspyyntöjen luokittelu luonnollisen kielen prosessoinnin avulla | |
| dc.type.ontasot | fi=Pro gradu -tutkielma|en=Master's thesis| |
Tiedostot
1 - 1 / 1