Neuroverkot taloudellisen aikasarjan ennustamisessa : Empiirinen tutkimus S&P 500 -indeksillä
Juvonen, Juuso (2020-03-30)
Neuroverkot taloudellisen aikasarjan ennustamisessa : Empiirinen tutkimus S&P 500 -indeksillä
Juvonen, Juuso
(30.03.2020)
Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.
avoin
Julkaisun pysyvä osoite on:
https://urn.fi/URN:NBN:fi-fe2020040812002
https://urn.fi/URN:NBN:fi-fe2020040812002
Tiivistelmä
Osakemarkkinahintojen ennustaminen on haastavaa, koska niiden taustalla on monimutkaista satunnaisuutta sekä dynaamisuutta ja näiden interaktio luo ennustamattomuutta. Tutkielmassa on ennustettu S&P 500 -osakeindeksin päivittäisiä hintoja käyttämällä kolmea eri neuroverkkoa sekä ARIMA-mallia. Menetelmien ennustamiskykyä on testattu soveltamalla keskimääräistä neliövirhettä. Osakeindeksi on ladattu Thomson Reuters Eikon -tietokannasta ajanjaksoilta 23.11.2011–31.10.2019 ja 8.11.2016–31.10.2019. Pidemmän ajanjakson kehitystä kuvaava taloudellinen aikasarja sisältää 2 250 havaintoa ja lyhyemmän 750 havaintoa. Edellisestä on käytetty 1 500 havaintoa ja jälkimmäisestä on käytetty 500 havaintoa verkkojen kouluttamiseen sekä ARIMA-mallin mallintamiseen. Aikasarjojen viimeisiä 750 ja 250 havaintoa on käytetty menetelmien ennustamiseen.
Tutkielmassa verkkojen ennustamiskykyä on lähestytty kahdella tutkimuskysymyksellä: Voidaanko neuroverkoilla ennustaa arvopapereiden hintoja käyttäen historiallista aikasarjaa? Soveltuvatko neuroverkot taloudellisen aikasarjan mallintamiseen ja ennustamiseen? Ensimmäisen tutkimuskysymyksen vastausta etsitään rahoitusteorioista, joista keskeisemmät ovat tehokkaiden markkinoiden hypoteesi sekä aikasarjan momentum-teoria. Empiirisesti on havaittu, että markkinat eivät ole täydellisen tehokkaita, jonka perusteella ensimmäisen tutkimuskysymyksen vastaus on, että neuroverkoilla voidaan ennustaa arvopapereiden hintoja käyttäen historiallista aikasarjaa. Tutkielman tuloksien perusteella toisen tutkimuskysymyksen vastaus on, että kaikki tutkielmassa käytetyt neuroverkot soveltuvat taloudellisen aikasarjan mallintamiseen ja ennustamiseen lyhyemmillä aikasarjoilla. Vain RNN- sekä LSTM-verkko soveltuvat myös pidemmille aikasarjoille.
Työn tulokset osoittavat, että RNN- sekä LSTM-verkkojen ennustamistarkkuudet ovat neuroverkoista tarkimpia, koska niiden tarkkuus eri kouluttamiskertojen välillä pysyy huomattavasti vakaampana kuin MLP-verkolla. Lisäksi ne kykenevät huomioimaan aikasarjan pidemmän aikavälin riippuvaisuuksia niiden muistiominaisuuksista johtuen. Neuroverkkojen ennustamiskyky sekä niiden luotettavuus ovat riittäviä, kun aikasarjat on differentioitu. ARIMAmalli oli tutkielman tarkin ja luotettavin, kun neuroverkoille syötettäviä aikasarjoja ei differentioitu.
Tutkielmassa verkkojen ennustamiskykyä on lähestytty kahdella tutkimuskysymyksellä: Voidaanko neuroverkoilla ennustaa arvopapereiden hintoja käyttäen historiallista aikasarjaa? Soveltuvatko neuroverkot taloudellisen aikasarjan mallintamiseen ja ennustamiseen? Ensimmäisen tutkimuskysymyksen vastausta etsitään rahoitusteorioista, joista keskeisemmät ovat tehokkaiden markkinoiden hypoteesi sekä aikasarjan momentum-teoria. Empiirisesti on havaittu, että markkinat eivät ole täydellisen tehokkaita, jonka perusteella ensimmäisen tutkimuskysymyksen vastaus on, että neuroverkoilla voidaan ennustaa arvopapereiden hintoja käyttäen historiallista aikasarjaa. Tutkielman tuloksien perusteella toisen tutkimuskysymyksen vastaus on, että kaikki tutkielmassa käytetyt neuroverkot soveltuvat taloudellisen aikasarjan mallintamiseen ja ennustamiseen lyhyemmillä aikasarjoilla. Vain RNN- sekä LSTM-verkko soveltuvat myös pidemmille aikasarjoille.
Työn tulokset osoittavat, että RNN- sekä LSTM-verkkojen ennustamistarkkuudet ovat neuroverkoista tarkimpia, koska niiden tarkkuus eri kouluttamiskertojen välillä pysyy huomattavasti vakaampana kuin MLP-verkolla. Lisäksi ne kykenevät huomioimaan aikasarjan pidemmän aikavälin riippuvaisuuksia niiden muistiominaisuuksista johtuen. Neuroverkkojen ennustamiskyky sekä niiden luotettavuus ovat riittäviä, kun aikasarjat on differentioitu. ARIMAmalli oli tutkielman tarkin ja luotettavin, kun neuroverkoille syötettäviä aikasarjoja ei differentioitu.