Stock market prediction with long short-term memory neural networks : Empirical study on Finnish stock market 1999–2020
Määttä, Jarkko (2020-12-01)
Stock market prediction with long short-term memory neural networks : Empirical study on Finnish stock market 1999–2020
Määttä, Jarkko
(01.12.2020)
Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.
avoin
Julkaisun pysyvä osoite on:
https://urn.fi/URN:NBN:fi-fe20201217101225
https://urn.fi/URN:NBN:fi-fe20201217101225
Tiivistelmä
In recent years, advanced machine learning techniques have outperformed previous benchmarks in multiple disciplines, and these methods have also been increasingly applied to stock market prediction tasks. This research aims to fill the research gap in advanced machine learning applications on Finnish stock market by applying long short-term memory (LSTM) neural networks on a stock return movement prediction task for the period between 1999–2020.
The performance of the LSTM network is benchmarked against a conventional recurrent neural network and a logistic regression classifier. Using two alternative sets of input features, the models are trained to produce weekly out-of-sample predictions on stock return movements between 2006 and 2020. Furthermore, these predictions are utilized to derive prediction-based investment portfolios. The best-performing multivariate LSTM model yields an annual return of 12.7% and delivers a Sharpe ratio of 0.459 before transaction costs, while a simple buy-and-hold portfolio achieved an annual return of 8.6% and a Sharpe ratio of 0.338 during the same period. The relative edge of the LSTM-based portfolios holds after transaction costs are considered, but a subperiod analysis reveals that the outperformance is not that eminent during the latter half of the sample.
By unveiling some common characteristics among the stocks selected for trading, the LSTMs are found to independently extract similar patterns to well-known capital market anomalies of short-term mean reversion and momentum. However, the high-level performance of LSTM models cannot be comprehensively explained by these abovementioned effects. The results indicate that the stock returns are partially driven by long-term signals, and that the LSTMs can independently extract this type of subtle information from noisy stock market data.
Despite being relatively complex and having high computational costs, LSTM networks are shown to be suitable methods for stock return movement prediction tasks. Even though the theoretical performance might not fully materialize if the trading strategy is implemented in practice, LSTMs certainly have predictive properties that make them useful tools and complements for different investment purposes. Viime vuosina koneoppimisen sovellutukset ovat osoittautuneet tehokkaiksi menetelmiksi useilla eri aloilla, ja näitä kehittyneitä menetelmiä on sovellettu yhä enemmän myös osakemarkkinoiden ennustamiseen. Tässä tutkimuksessa sovelletaan LSTM-neuroverkkoja osaketuottojen liikkeiden ennustamiseen Suomen osakemarkkinoilla vuosien 1999–2020 aikana.
LSTM-neuroverkon suorituskykyä verrataan tavanomaiseen takaisinkytkeytyvään neuroverkkoon sekä logistiseen regressiomalliin. Kahdenlaisten eri syötteiden avulla mallit koulutetaan ennustamaan osaketuottojen liikkeitä vuosina 2006–2020, ja näiden ennusteiden pohjalta rakennetaan yksinkertaistettu kaupankäyntistrategia. Parhaiten suoriutuva, useaa syötemuuttujaa hyödyntävä LSTM-neuroverkko yltää 12,7%: n vuosittaiseen tuottoon ja saavuttaa Sharpe-suhdeluvun 0,459 ennen transaktiokustannuksia, kun taas yksinkertainen osta ja pidä -salkku saavuttaa vuotuisen tuoton 8,6% ja Sharpe-suhdeluvun 0,338 samalla tarkastelujaksolla. LSTM-pohjaisten salkkujen suhteellinen etu säilyy transaktiokustannusten huomioon ottamisen jälkeenkin, mutta osittaisperiodikohtainen analyysi paljastaa, että suorituskyky ei ole merkittävästi parempi enää tarkastelujakson loppupuoliskolla.
Tutkimalla LSTM-neuroverkon kaupankäyntiin poimimien osakkeiden yhteisiä piirteitä, havaitaan mallin hyödyntävän samanlaisia kaavoja kuin tunnettuihin markkina-anomalioihin perustuvat strategiat. LSTM-mallien korkean tason suorituskykyä ei kuitenkaan voida selittää kattavasti ainoastaan momentum-teorian tai keskiarvoon palautumisen avulla. Tulokset osoittavat, että osaketuotot ovat osittain pitkäkestoisten signaalien ohjaamia, ja että LSTM-neuroverkot kykenevät itsenäisesti poimimaan tämänkaltaisia signaaleja paljon kohinaa sisältävästä markkinadatasta.
Huolimatta LSTM-neuroverkkojen monimutkaisuudesta ja niiden laskennallisista kustannuksista, tulokset osittavat niiden olevan hyödyllisiä menetelmiä osaketuottojen liikkeiden ennustamiseen. Vaikka teoreettinen suorituskyky ei täysimääräisesti olisi siirrettävissä käytäntöön, LSTM-neuroverkot tarjoavat kuitenkin suotavia ominaisuuksia, jotka tekevät niistä hyödyllisiä työkaluja käytettäväksi erilaisissa sijoitustarkoituksissa.
The performance of the LSTM network is benchmarked against a conventional recurrent neural network and a logistic regression classifier. Using two alternative sets of input features, the models are trained to produce weekly out-of-sample predictions on stock return movements between 2006 and 2020. Furthermore, these predictions are utilized to derive prediction-based investment portfolios. The best-performing multivariate LSTM model yields an annual return of 12.7% and delivers a Sharpe ratio of 0.459 before transaction costs, while a simple buy-and-hold portfolio achieved an annual return of 8.6% and a Sharpe ratio of 0.338 during the same period. The relative edge of the LSTM-based portfolios holds after transaction costs are considered, but a subperiod analysis reveals that the outperformance is not that eminent during the latter half of the sample.
By unveiling some common characteristics among the stocks selected for trading, the LSTMs are found to independently extract similar patterns to well-known capital market anomalies of short-term mean reversion and momentum. However, the high-level performance of LSTM models cannot be comprehensively explained by these abovementioned effects. The results indicate that the stock returns are partially driven by long-term signals, and that the LSTMs can independently extract this type of subtle information from noisy stock market data.
Despite being relatively complex and having high computational costs, LSTM networks are shown to be suitable methods for stock return movement prediction tasks. Even though the theoretical performance might not fully materialize if the trading strategy is implemented in practice, LSTMs certainly have predictive properties that make them useful tools and complements for different investment purposes.
LSTM-neuroverkon suorituskykyä verrataan tavanomaiseen takaisinkytkeytyvään neuroverkkoon sekä logistiseen regressiomalliin. Kahdenlaisten eri syötteiden avulla mallit koulutetaan ennustamaan osaketuottojen liikkeitä vuosina 2006–2020, ja näiden ennusteiden pohjalta rakennetaan yksinkertaistettu kaupankäyntistrategia. Parhaiten suoriutuva, useaa syötemuuttujaa hyödyntävä LSTM-neuroverkko yltää 12,7%: n vuosittaiseen tuottoon ja saavuttaa Sharpe-suhdeluvun 0,459 ennen transaktiokustannuksia, kun taas yksinkertainen osta ja pidä -salkku saavuttaa vuotuisen tuoton 8,6% ja Sharpe-suhdeluvun 0,338 samalla tarkastelujaksolla. LSTM-pohjaisten salkkujen suhteellinen etu säilyy transaktiokustannusten huomioon ottamisen jälkeenkin, mutta osittaisperiodikohtainen analyysi paljastaa, että suorituskyky ei ole merkittävästi parempi enää tarkastelujakson loppupuoliskolla.
Tutkimalla LSTM-neuroverkon kaupankäyntiin poimimien osakkeiden yhteisiä piirteitä, havaitaan mallin hyödyntävän samanlaisia kaavoja kuin tunnettuihin markkina-anomalioihin perustuvat strategiat. LSTM-mallien korkean tason suorituskykyä ei kuitenkaan voida selittää kattavasti ainoastaan momentum-teorian tai keskiarvoon palautumisen avulla. Tulokset osoittavat, että osaketuotot ovat osittain pitkäkestoisten signaalien ohjaamia, ja että LSTM-neuroverkot kykenevät itsenäisesti poimimaan tämänkaltaisia signaaleja paljon kohinaa sisältävästä markkinadatasta.
Huolimatta LSTM-neuroverkkojen monimutkaisuudesta ja niiden laskennallisista kustannuksista, tulokset osittavat niiden olevan hyödyllisiä menetelmiä osaketuottojen liikkeiden ennustamiseen. Vaikka teoreettinen suorituskyky ei täysimääräisesti olisi siirrettävissä käytäntöön, LSTM-neuroverkot tarjoavat kuitenkin suotavia ominaisuuksia, jotka tekevät niistä hyödyllisiä työkaluja käytettäväksi erilaisissa sijoitustarkoituksissa.