Tekstien uudelleenkäyttö suomalaisessa sanoma- ja aikakauslehdistössä 1771–1920. Digitaalisten ihmistieteiden näkökulma

dc.contributor.authorRantala Heli
dc.contributor.authorSalmi Hannu
dc.contributor.authorNivala Asko
dc.contributor.authorPaju Petri
dc.contributor.authorSippola Reetta
dc.contributor.authorVesanto Aleksi
dc.contributor.authorGinter Filip
dc.contributor.organizationfi=historia ja arkeologia|en=History and Archaelogy|
dc.contributor.organizationfi=kieli- ja puheteknologia|en=Language and Speech Technology|
dc.contributor.organization-code1.2.246.10.2458963.20.47465613983
dc.contributor.organization-code1.2.246.10.2458963.20.62219672581
dc.converis.publication-id39845510
dc.converis.urlhttps://research.utu.fi/converis/portal/Publication/39845510
dc.date.accessioned2022-10-28T14:40:48Z
dc.date.available2022-10-28T14:40:48Z
dc.description.abstract<p>Artikkelissa tutkitaan suomalaista sanoma- ja aikakauslehdistöä tekstin uudelleenkäytön näkökulmasta.Saman tekstin julkaiseminen uudelleen eri yhteyksissä on sinänsä vanha ja tunnettu ilmiö, mutta ennen sanoma- ja aikakauslehtien digitoimista tätä lehdistön piirrettä ei ole voitu tutkia systemaattisesti. Tutkimuksen lähdeaineistona on Suomen Kansalliskirjaston julkaisema sanoma- ja aikakauslehtien digitoitu OCR-korpus, josta on COMHIS-hankkeessa kehitetyn, tekstin uudelleenkäytön tunnistavan BLAST-menetelmän avulla etsitty lehdistössä esiintyvää kopiointia ja toisteisuutta. Aikavälillä 1771–1920 toistoa sisältäviä tekstejä tai tekstikatkelmia on löytynyt noin 13,8 miljoonan klusterin eli pidemmän merkkijonon verran. Artikkelissa esitellään sekä itse uudelleenkäytön tunnistukseen käytettyä BLAST-menetelmää että tämän tunnistuksen tuloksia. Tutkimus osoittaa, että tekstien kopioiminen ja uudelleenkäyttö on merkittävä osa suomalaista lehdistöä. Menetelmänä tekstien uudelleenkäytön tunnistus tarjoaa uuden keinon tutkia informaation liikkeitä ja reittejä.<br /><br />This article explores Finnish newspapers and periodicals produced between 1771 and 1920, with a focus on the reuse of texts. While the reprinting of particular texts in a range of different locations can be regarded as an old and well-acknowledged practice in the press, a systematic examination was not possible until the digitization of these historical documents. This primary research material derives from the digitized OCR corpus of newspapers and periodicals published by the National Library of Finland. In the COMHIS project, we have developed a text-mining software, based on NCBI BLAST, which effectively recognizes and enables the location of textual repetitions. We have found approximately 13.8 million clusters of text reuse. As well as an introduction to the methods and uses of BLAST, the article will also explore the results gained through these and what they reveal about the nature of the circulation of information in the Finnish press during this period. This article shows that the copying and reuse of texts was a remarkable part of the process.<br /></p>
dc.format.pagerange53
dc.format.pagerange67
dc.identifier.jour-issn0018-2362
dc.identifier.olddbid189639
dc.identifier.oldhandle10024/172733
dc.identifier.urihttps://www.utupub.fi/handle/11111/44712
dc.identifier.urlhttps://www.historiallinenaikakauskirja.fi/paasivu
dc.identifier.urnURN:NBN:fi-fe2021042827535
dc.language.isofi
dc.okm.affiliatedauthorRantala, Heli
dc.okm.affiliatedauthorSalmi, Hannu
dc.okm.affiliatedauthorNivala, Asko
dc.okm.affiliatedauthorPaju, Petri
dc.okm.affiliatedauthorSippola, Reetta
dc.okm.affiliatedauthorVesanto, Aleksi
dc.okm.affiliatedauthorGinter, Filip
dc.okm.discipline615 History and archaeologyen_GB
dc.okm.discipline615 Historia ja arkeologiafi_FI
dc.okm.internationalcopublicationnot an international co-publication
dc.okm.internationalityDomestic publication
dc.okm.typeA1 ScientificArticle
dc.publisherSuomen Historiallinen Seura ja Historian Ystäväin Liitto
dc.publisher.countryFinlanden_GB
dc.publisher.countrySuomifi_FI
dc.publisher.country-codeFI
dc.relation.ispartofjournalHistoriallinen Aikakauskirja
dc.relation.issue1
dc.relation.volume117
dc.source.identifierhttps://www.utupub.fi/handle/10024/172733
dc.titleTekstien uudelleenkäyttö suomalaisessa sanoma- ja aikakauslehdistössä 1771–1920. Digitaalisten ihmistieteiden näkökulma
dc.year.issued2019

Tiedostot

Näytetään 1 - 1 / 1
Ladataan...
Name:
HAik Rantala et al.pdf
Size:
124.58 KB
Format:
Adobe Portable Document Format
Description:
Final draft