The Use of Large Language Models for Information Extraction

dc.contributor.authorHeino, Tiia
dc.contributor.departmentfi=Kone- ja materiaalitekniikan laitos|en=Department of Mechanical and Materials Engineering|
dc.contributor.facultyfi=Teknillinen tiedekunta|en=Faculty of Technology|
dc.contributor.studysubjectfi=Materiaalitekniikka|en=Materials Engineering|
dc.date.accessioned2025-06-27T21:30:14Z
dc.date.available2025-06-27T21:30:14Z
dc.date.issued2025-06-25
dc.description.abstractLarge Language Models (LLM) are Artificial Intelligence (AI) models that can be fine-tuned for specific tasks. They can be used for Information Extraction (IE), a domain of Natural Language Processing (NLP), that aims to extract information from unstructured text and convert it into structured, machine-readable data. Using LLMs for IE allows for more accurate and less time-consuming extraction. For materials science using LLMs for IE enables a more automated extraction that can be used with Materials Science Databases, that store diverse data on different materials. With these tools materials science research can go towards a new era with data-driven studies. Using LLMs does have its challenges with hallucinations, environmental costs and transparency issues.
dc.description.abstractSuuret kielimallit ovat tekoälymalleja, joita voidaan hienosäätää tiettyjä tehtäviä varten. Niitä voidaan käyttää tiedonlouhintaan, joka on luonnollisen kielen prosessoinnin osa-alue, jonka tavoitteena on poimia tietoa jäsentymättömästä tekstistä ja muuntaa se jäsennellyksi, koneella luettavaksi dataksi. Mallien käyttö tiedonlouhinnassa mahdollistaa tarkemman ja vähemmän aikaa vievän louhinnan. Materiaalitieteessä mallien käyttö tiedonlouhintaan mahdollistaa automatisoidumman louhinnan, jota voidaan käyttää Materiaalitieteellisten Tietopankkien kanssa, jotka sisältävät monipuolista tietoa eri materiaaleista. Näiden työkalujen avulla materiaalitieteellinen tutkimus voi siirtyä uuteen datapainoitteiseen aikakauteen. Suurten kielimallien käyttöön liittyy kuitenkin haasteita, joita ovat hallusinaatiot, ympäristökustannukset ja haasteet läpinäkyvyydessä.
dc.format.extent21
dc.identifier.olddbid199471
dc.identifier.oldhandle10024/182502
dc.identifier.urihttps://www.utupub.fi/handle/11111/804
dc.identifier.urnURN:NBN:fi-fe2025062775362
dc.language.isoeng
dc.rightsfi=Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.|en=This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.|
dc.rights.accessrightsavoin
dc.source.identifierhttps://www.utupub.fi/handle/10024/182502
dc.subjectLarge Language Models, Information Extraction, Artificial Intelligence, materials science.
dc.titleThe Use of Large Language Models for Information Extraction
dc.type.ontasotfi=Kandidaatintutkielma|en=Bachelor's thesis|

Tiedostot

Näytetään 1 - 1 / 1
Ladataan...
Name:
Heino_Tiia_opinnayte.pdf
Size:
364.72 KB
Format:
Adobe Portable Document Format