Hyppää sisältöön
    • Suomeksi
    • In English
  • Suomeksi
  • In English
  • Kirjaudu
Näytä aineisto 
  •   Etusivu
  • 3. UTUCris-artikkelit
  • Rinnakkaistallenteet
  • Näytä aineisto
  •   Etusivu
  • 3. UTUCris-artikkelit
  • Rinnakkaistallenteet
  • Näytä aineisto
JavaScript is disabled for your browser. Some features of this site may not work without it.

Explainable Publication Year Prediction of Eighteenth Century Texts with the BERT Model

Rastas Iiro; Ryan Yann; Tiihonen Iiro; Qaraei Mohammedreza; Repo Liina; Babbar Rohit; Mäkelä Eetu; Tolonen Mikko; Ginter Filip

Explainable Publication Year Prediction of Eighteenth Century Texts with the BERT Model

Rastas Iiro
Ryan Yann
Tiihonen Iiro
Qaraei Mohammedreza
Repo Liina
Babbar Rohit
Mäkelä Eetu
Tolonen Mikko
Ginter Filip
Katso/Avaa
2022_Rastas_Explainable_Publ_ACL.pdf (410.2Kb)
Lataukset: 

URI
https://aclanthology.org/2022.lchange-1.7.pdf
Näytä kaikki kuvailutiedot
Julkaisun pysyvä osoite on:
https://urn.fi/URN:NBN:fi-fe2022110164053
Tiivistelmä
In this paper, we describe a BERT model trained on the Eighteenth Century Collections Online (ECCO) dataset of digitized documents. The ECCO dataset poses unique modelling challenges due to the presence of Optical Character Recognition (OCR) artifacts. We establish the performance of the BERT model on a publication year prediction task against linear baseline models and human judgement, finding the BERT model to be superior to both and able to date the works, on average, with less than 7 years absolute error. We also explore how language change over time affects the model by analyzing the features the model uses for publication year predictions as given by the Integrated Gradients model explanation method.
Kokoelmat
  • Rinnakkaistallenteet [27094]

Turun yliopiston kirjasto | Turun yliopisto
julkaisut@utu.fi | Tietosuoja | Saavutettavuusseloste
 

 

Tämä kokoelma

JulkaisuajatTekijätNimekkeetAsiasanatTiedekuntaLaitosOppiaineYhteisöt ja kokoelmat

Omat tiedot

Kirjaudu sisäänRekisteröidy

Turun yliopiston kirjasto | Turun yliopisto
julkaisut@utu.fi | Tietosuoja | Saavutettavuusseloste