Hyppää sisältöön
    • Suomeksi
    • In English
  • Suomeksi
  • In English
  • Kirjaudu
Näytä aineisto 
  •   Etusivu
  • 1. Kirjat ja opinnäytteet
  • Pro gradu -tutkielmat ja diplomityöt sekä syventävien opintojen opinnäytetyöt (kokotekstit)
  • Näytä aineisto
  •   Etusivu
  • 1. Kirjat ja opinnäytteet
  • Pro gradu -tutkielmat ja diplomityöt sekä syventävien opintojen opinnäytetyöt (kokotekstit)
  • Näytä aineisto
JavaScript is disabled for your browser. Some features of this site may not work without it.

Melkein vai lähes - synonymiaa?

Lähde, Petra (2024-05-05)

Melkein vai lähes - synonymiaa?

Lähde, Petra
(05.05.2024)
Katso/Avaa
Lahde_Petra_opinnayte.pdf (913.6Kb)
Lataukset: 

Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.
avoin
Näytä kaikki kuvailutiedot
Julkaisun pysyvä osoite on:
https://urn.fi/URN:NBN:fi-fe2024060342614
Tiivistelmä
Ihmiskielissä on samanmerkityksisiä sanoja, joita voidaan kutsua synonyymeiksi. Kaikki samatarkoitteiset sanat eivät kuitenkaan jaa keskenään samaa merkityskenttää täydellisesti. Koska täydellinen synonymia on harvinaista, on syytä olettaa, että läheisilläkin synonyymeilla on joitakin eroja, jolloin voidaan puhua melkein-synonymiasta.
Tässä kognitiiviseen kielioppiteoriaan pohjaavassa tutkimuksessa käsitellään suomen kielen astemääritteitä melkein ja lähes adjektiivien yhteydessä. Lähtökohta on, että sanojen välille voidaan löytää eroavaisuuksia, ja siten sanat ovat melkein-synonyymejä. Tämän tutkimiseen käytettiin riippuvuussuhdeprofiileja, jotka perustuvat sanojen syntaktisiin riippuvuussuhteisiin spontaanissa kielenkäytössä. Riippuvuussuhdeprofiilit eivät vaadi suuria teoreettisia pohjaolettamia, vaan ne muodostuvat yksinkertaisesti sanojen syntaktisista suhteista.
Tutkimuksen aineisto koostuu Finnish Internet Parsebankin niistä virkkeistä, jotka sisältävät joko sanan lähes tai melkein adjektiivin yhteydessä. Aineisto on jäsennetty syntaktisesti noudattaen Universal Dependencies –skeemaa. Jäsennellystä aineistosta muodostettiin biarceja (kaksoiskaaria), jotka kuvastavat lauseen sisäisiä syntaktisia suhteita. Lopullisesta aineistosta poistettiin kaikki leksikaalinen informaatio. Lauseita oli kaiken kaikkiaan 16 833, joista 8950 sisälsi sanan melkein ja 7883 sanan lähes.
Tutkimusta varten ohjelmoitiin tukivektorikoneluokittelija, joka tunnistaa lauseen syntaktisten riippuvuussuhteiden perusteella, kumpi tutkimuskohteista tulee lauseessa kyseeseen. Luokittelijan luokat olivat lähes ja melkein, ja ennustaja lauseiden biarcit. Luokkia tasattiin niin, että kummastakin luokasta poimittiin satunnaisesti 7500 esimerkkiä. Aineisto jaettiin niin ikään satunnaisesti koulutusja testidataan (80 % / 20 %), ja mallin koulutus toistettiin 100 kertaa. Mallin oletettu perustaso oli 0.5. Malli saavutti 0.633 osuvuuden (accuracy), mikä osoittaa, että sanojen riippuvuussuhdeprofiilit ovat erilaiset.
Luokittelijasta saaduista sanoja erottavista riippuvuussuhdepiirteistä sanalle lähes ainoa uniikki piirre olivat punct, eli välimerkit; sanalle melkein puolestaan nsubj eli nominaalisubjekti ja nmod:poss eli possessiivinen nominaalimäärite. Molemmissa luokissa esiintyvät ROOT (juuri) ja obl (obliikvinominaali) osoittivat toisistaan poikkeavia riippuvuusyhtymiä eri luokkien välillä. Tutkimuksen perusteella näyttäisi siltä, että astemääritteet melkein ja lähes eivät ole täysin synonyymisia. Lisätutkimusta kuitenkin vaatii se, mitä tällä tutkimuksella esiin saadut riippuvuussuhdepiirteet pitävät sisällään.
Kokoelmat
  • Pro gradu -tutkielmat ja diplomityöt sekä syventävien opintojen opinnäytetyöt (kokotekstit) [9208]

Turun yliopiston kirjasto | Turun yliopisto
julkaisut@utu.fi | Tietosuoja | Saavutettavuusseloste
 

 

Tämä kokoelma

JulkaisuajatTekijätNimekkeetAsiasanatTiedekuntaLaitosOppiaineYhteisöt ja kokoelmat

Omat tiedot

Kirjaudu sisäänRekisteröidy

Turun yliopiston kirjasto | Turun yliopisto
julkaisut@utu.fi | Tietosuoja | Saavutettavuusseloste