Syväoppimisen käyttö musiikin tyylilajin tunnistamisessa

dc.contributor.authorVäänänen, Väinö
dc.contributor.departmentfi=Tietotekniikan laitos|en=Department of Computing|
dc.contributor.facultyfi=Teknillinen tiedekunta|en=Faculty of Technology|
dc.contributor.studysubjectfi=Tietotekniikka|en=Information and Communication Technology|
dc.date.accessioned2025-05-13T21:30:51Z
dc.date.available2025-05-13T21:30:51Z
dc.date.issued2025-05-09
dc.description.abstractMusiikin tyylilajin tunnistaminen on keskeinen osa musiikin analysointia ja sen merkitys on kasvanut suoratoistopalveluiden myötä. Syväoppimismallit automatisoivat musiikin luokittelun tehokkaasti ilman manuaalisia metatietoja. Tässä tutkielmassa tarkastellaan kolmea keskeistä syväoppimismallia: konvoluutioneuroverkkoja, pitkän lyhytkestomuistin verkkoja (LSTM) ja transformereita. GTZAN-musiikkiaineisto on yksi yleisimmin käytetyistä tietokokonaisuuksista musiikin tyylilajiluokituksen tutkimuksessa, ja se sisältää 10 eri tyylilajia. Tämä aineisto toimii monien syväoppimismallien vertailupohjana, sillä sen avulla voidaan arvioida mallien kykyä tunnistaa musiikillisia piirteitä ja erottaa tyylilajeja toisistaan. Konvoluutioneuroverkot hyödyntävät spektrogrammeja ja erottuvat kyvyllään tunnistaa paikallisia piirteitä, kuten rytmiä ja harmoniaa. LSTM-verkot keskittyvät ajallisiin riippuvuuksiin, mikä soveltuu musiikin analysointiin. Transformerit puolestaan hyödyntävät itsehuomiomekanismia, joka mahdollistaa laajempien yhteyksien tunnistamisen koko musiikkinäytteessä. Tutkimustulokset osoittivat, että konvoluutioneuroverkko saavutti parhaan tarkkuuden (83,3 %), transformer-mallit olivat toiseksi tarkimpia (76 %), ja LSTM-mallin suorituskyky jäi alhaisemmaksi (52,98 %). Eri mallien vahvuudet ja heikkoudet korostavat hybridimallien potentiaalia musiikin analyysissä. Tutkielma nostaa esiin haasteet, kuten datan esikäsittelyn vaikutuksen mallin suorituskykyyn sekä musiikin subjektiivisen luokittelun vaikeuden. Tulevaisuudessa yhdistelmämallit ja suuremmat koulutusaineistot voivat parantaa syväoppimisen tarkkuutta musiikin analysoinnissa.
dc.format.extent25
dc.identifier.olddbid198104
dc.identifier.oldhandle10024/181142
dc.identifier.urihttps://www.utupub.fi/handle/11111/4118
dc.identifier.urnURN:NBN:fi-fe2025051341873
dc.language.isofin
dc.rightsfi=Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.|en=This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.|
dc.rights.accessrightssuljettu
dc.source.identifierhttps://www.utupub.fi/handle/10024/181142
dc.subjectMusiikin tyylilajin tunnistaminen, GTZAN, konvoluutioneuroverkot (CNN), LSTM, Transformer
dc.titleSyväoppimisen käyttö musiikin tyylilajin tunnistamisessa
dc.type.ontasotfi=Kandidaatintutkielma|en=Bachelor's thesis|

Tiedostot

Näytetään 1 - 1 / 1
Ladataan...
Name:
Syv%C3%A4oppimisen%20k%C3%A4ytt%C3%B6%20musiikin%20tyylilajin%20tunnistamisessa.pdf
Size:
799.02 KB
Format:
Adobe Portable Document Format