Venäjänkielisten internettekstien annotointi ja rekisterien vertailu suomen ja venäjän välillä
| dc.contributor.author | Särkioja, Nella | |
| dc.contributor.department | fi=Kieli- ja käännöstieteiden laitos|en=School of Languages and Translation Studies| | |
| dc.contributor.faculty | fi=Humanistinen tiedekunta|en=Faculty of Humanities| | |
| dc.contributor.studysubject | fi=Digitaalinen kielentutkimus|en=Digital Language Studies| | |
| dc.date.accessioned | 2023-06-07T21:06:48Z | |
| dc.date.available | 2023-06-07T21:06:48Z | |
| dc.date.issued | 2023-05-03 | |
| dc.description.abstract | Tutkielman aiheena on internettekstien jakautuminen rekistereihin. Tutkielmassa käytetään valmiita rekisteriluokkia ja luodaan käsin venäjänkielinen aineisto, jossa venäjänkielisiä internettekstejä on luokiteltu rekistereihin. Tarkoituksena on kuvata venäjänkielistä aineistoa rekistereiden avulla sekä vertailla sitä suomenkielisten rekistereiden kanssa. Tutkimus liittyy Turun yliopistossa käynnissä olevaan hankkeeseen Uutinen, mielipide vai jotain muuta? Erilaiset tekstit ja niiden automaattinen tunnistus monikielisestä internetistä, jossa kehitetään erilaisia automaattisia menetelmiä jaottelemaan internettekstejä rekistereihin. Tutkimuksen aineisto on koottu vapaasta internetistä ja annotoitu yhtenevin ohjeistuksin. Venäjänkielinen aineisto on annotoitu tutkielmaa varten ja vertailuun käytetään suomenkielistä, valmiiksi annotoitua aineistoa. Tutkielman tavoitteena on tuottaa uutta tietoa rekistereistä tarkastelemalla ja vertailemalla rekisterien frekvenssejä sekä yksittäisiä esimerkkejä tarkastelemalla. Tärkeänä osana tutkielmaa on uusi, venäjänkielinen aineisto rekisteritutkimusta varten, joka on vapaasti saatavilla https://github.com/TurkuNLP/RuCORE. Suomenkielisiä ja venäjänkielisiä rekistereitä tarkastelemalla huomattiin paljon yhteneväisyyksiä mutta myös eroja kielten välillä. | |
| dc.format.extent | 41 | |
| dc.identifier.olddbid | 192224 | |
| dc.identifier.oldhandle | 10024/175302 | |
| dc.identifier.uri | https://www.utupub.fi/handle/11111/17485 | |
| dc.identifier.urn | URN:NBN:fi-fe2023060752773 | |
| dc.language.iso | fin | |
| dc.rights | fi=Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.|en=This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.| | |
| dc.rights.accessrights | avoin | |
| dc.source.identifier | https://www.utupub.fi/handle/10024/175302 | |
| dc.subject | kielitiede, kieliteknologia, annotointi, rekisteri, rekisteriluokka | |
| dc.title | Venäjänkielisten internettekstien annotointi ja rekisterien vertailu suomen ja venäjän välillä | |
| dc.type.ontasot | fi=Pro gradu -tutkielma|en=Master's thesis| |
Tiedostot
1 - 1 / 1