Taulukoiden tunnistus osana OCR-pipelinea

dc.contributor.authorLarkiola, Ilari
dc.contributor.departmentfi=Tietotekniikan laitos|en=Department of Computing|
dc.contributor.facultyfi=Teknillinen tiedekunta|en=Faculty of Technology|
dc.contributor.studysubjectfi=Tietotekniikka|en=Information and Communication Technology|
dc.date.accessioned2025-10-03T21:30:31Z
dc.date.available2025-10-03T21:30:31Z
dc.date.issued2025-09-29
dc.description.abstractTämä tutkimus keskittyy taulukoiden tunnistukseen osana OCR-pipelinea historiallisista dokumenteista. Tutkimuksessa keskityttiin erikseen printattuihin ja käsinpiirrettyihin taulukoihin. Tutkimuksen tavoitteena oli selvittää, kuinka hyvin taulukoiden automaattinen tunnistus onnistuu käyttämällä YOLO11-malliversioihin perustuvia koneoppimismalleja sekä kuinka mallin koko ja koulutusparametrit, kuten epokkien määrä ja neuroverkon syvyys vaikuttavat mallin suorituskykyyn. Aineistona käytettiin Suomen Sukuhistoriallisen Yhdistyksen digitoituja muuttokirjoja, jotka sisälsivät rakenteellisesti vaihtelevia ja visuaalisesti haastavia dokumentteja. Käsin annotoitu aineisto jaettiin kolmeen luokkaan: sivun otsikko, taulukon otsikkorivi ja itse taulukko, mikä mahdollisti mallien kouluttamisen ja niiden suorituskyvyn vertailun eri datatyyppien välillä. Mallien tarkkuuteen vaikuttivat merkittävästi koulutusparametrit ja aineiston rakenne. Parhaat tulokset saavutettiin 100 epokin koulutuksella, ja kevyempi YOLO11s-malli osoittautui hyväksi ja resurssitehokkaaksi vaihtoehdoksi, vaikka suurempi YOLO11l-malli tarjosi tietyissä tilanteissa hieman paremman tarkkuuden. Printatulla datalla koulutettu malli kykeni osittain ennustamaan myös käsinpiirrettyä dataa, erityisesti varsinaisen taulukon osalta. Tulokset viittaavat siihen, että hyvin konfiguroidut YOLO-pohjaiset ratkaisut voivat tukea tehokasta taulukoiden tunnistusta ja tiedon keruuta vaihtelevista dokumenttimuodoista osana OCR-järjestelmiä.
dc.format.extent34
dc.identifier.olddbid211244
dc.identifier.oldhandle10024/194267
dc.identifier.urihttps://www.utupub.fi/handle/11111/885
dc.identifier.urnURN:NBN:fi-fe2025100399587
dc.language.isofin
dc.rightsfi=Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.|en=This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.|
dc.rights.accessrightsavoin
dc.source.identifierhttps://www.utupub.fi/handle/10024/194267
dc.subjecttaulukoiden tunnistus, OCR, YOLO, koneoppiminen
dc.titleTaulukoiden tunnistus osana OCR-pipelinea
dc.type.ontasotfi=Kandidaatintutkielma|en=Bachelor's thesis|

Tiedostot

Näytetään 1 - 1 / 1
Ladataan...
Name:
Larkiola%20Ilari%20Kandi%202025.pdf
Size:
4.6 MB
Format:
Adobe Portable Document Format