Erot sukupuolten välillä politiikan uutisoinnissa : koneoppimista hyödyntävä analyysi
Pardalin, Iidaliisa (2022-11-15)
Erot sukupuolten välillä politiikan uutisoinnissa : koneoppimista hyödyntävä analyysi
Pardalin, Iidaliisa
(15.11.2022)
Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.
avoin
Julkaisun pysyvä osoite on:
https://urn.fi/URN:NBN:fi-fe2022121270537
https://urn.fi/URN:NBN:fi-fe2022121270537
Tiivistelmä
Tämä tutkimus selvittää, onko sukupuolten välisiä eroja politiikan uutisoinnissa ja jos on, millaisia erot ovat. Aineistona on Yle Uutisten ja Helsingin Sanomien internet-sivuilla 31.12.2019–31.12.2021 julkaistuja uutisia. Aineistoa on tutkittu koneoppimismenetelmin korpusavusteisen diskurssianalyysin keinoja käyttäen. 53 167 Yle Uutisten ja 96 513 Helsingin Sanomien uutista käsiteltiin niin, että lopulliseen aineistoon saatiin Yle Uutisten osalta 16 659 ja Helsingin Sanomien osalta 17 023 virkettä, joissa mainitaan kansanedustaja joko koko nimeltä tai sukunimeltä. Näistä virkkeistä luotiin korpus, jonka avulla tehtiin laadullista analyysiä.
Tutkimusta vartein on ohjelmoitu tukivektorikoneluokittelija, joka pyrkii ennustamaan, käsitteleekö virke nais- vai mieskansanedustajaa. Sekä Yle Uutisten että Helsingin Sanomien aineiston osalta luokittelija kykeni perustasoa parempaan täsmällisyyteen; Yle Uutisten osalta perustaso oli 0.58 ja mallin täsmällisyys 0.67, Helsingin Sanomien perustaso oli 0.56 ja mallin täsmällisyys myös 0.67.
Analysoimalla luokittelijan luokittelussa käyttämiä piirteitä eli sanoja tutkimuksessa saatiin selville, millaisia eroavaisuuksia nais- ja mieskansanedustajia käsittelevissä uutisissa oli. Analyysiä tehtiin jakamalla sanoja eri ryhmiin sekä tekemällä virkkeistä luodun korpuksen avulla konkordanssitarkastelua siitä, millaisissa yhteyksissä kyseiset sanat esiintyivät alkuperäisissä virkkeissä.
Osa eroista on selitettävissä nais- ja mieskansanedustajien erilaisilla tehtävillä ja nimikkeillä, mutta muitakin eroja löytyi. Tutkimustulokset antava siis viitteitä siitä, että nais- ja mieskansanedustajien kohtelu mediassa on erilaista: esimerkiksi sanat sukupuoli, nainen ja äiti osoittautuivat erotteleviksi piirteiksi naisia käsittelevissä virkkeissä.
Laajempi aineisto, erilaiset painotukset sekä pyrkimykset selvittää mahdollisten erojen syitä olisivat tärkeitä jatkotutkimuksen aiheita.
Tutkimusta vartein on ohjelmoitu tukivektorikoneluokittelija, joka pyrkii ennustamaan, käsitteleekö virke nais- vai mieskansanedustajaa. Sekä Yle Uutisten että Helsingin Sanomien aineiston osalta luokittelija kykeni perustasoa parempaan täsmällisyyteen; Yle Uutisten osalta perustaso oli 0.58 ja mallin täsmällisyys 0.67, Helsingin Sanomien perustaso oli 0.56 ja mallin täsmällisyys myös 0.67.
Analysoimalla luokittelijan luokittelussa käyttämiä piirteitä eli sanoja tutkimuksessa saatiin selville, millaisia eroavaisuuksia nais- ja mieskansanedustajia käsittelevissä uutisissa oli. Analyysiä tehtiin jakamalla sanoja eri ryhmiin sekä tekemällä virkkeistä luodun korpuksen avulla konkordanssitarkastelua siitä, millaisissa yhteyksissä kyseiset sanat esiintyivät alkuperäisissä virkkeissä.
Osa eroista on selitettävissä nais- ja mieskansanedustajien erilaisilla tehtävillä ja nimikkeillä, mutta muitakin eroja löytyi. Tutkimustulokset antava siis viitteitä siitä, että nais- ja mieskansanedustajien kohtelu mediassa on erilaista: esimerkiksi sanat sukupuoli, nainen ja äiti osoittautuivat erotteleviksi piirteiksi naisia käsittelevissä virkkeissä.
Laajempi aineisto, erilaiset painotukset sekä pyrkimykset selvittää mahdollisten erojen syitä olisivat tärkeitä jatkotutkimuksen aiheita.