Reinforcement Learning Methods for Multi-Robot Systems

Puotunen, Eetu

Reinforcement Learning Methods for Multi-Robot Systems

dc.contributor.author	Puotunen, Eetu
dc.contributor.department	fi=Kone- ja materiaalitekniikan laitos\|en=Department of Mechanical and Materials Engineering\|
dc.contributor.faculty	fi=Teknillinen tiedekunta\|en=Faculty of Technology\|
dc.contributor.studysubject	fi=Konetekniikka\|en=Mechanical Engineering\|
dc.date.accessioned	2026-05-27T19:01:46Z
dc.date.issued	2026-05-19
dc.description.abstract	Reinforcement learning has become promising solution to many tasks that are hard to solve with conventional methods due to complex and dynamic environments. Reinforcement learning is based on agent trying actions and getting feedback from the environment. Multi-agent reinforcement learning (MARL) expands the potential of single-agent reinforcement learning methods to multi-robot system. In multi-agent settings, agents can interact with each other making learning more difficult. MARL application areas include for example mobile-robot fleets in warehouse logistics and UAV swarms for target search task. The thesis provides brief theoretical background of reinforcement learning and multi-robot systems. Literature review section shows, how different MARL methods achieve coordination and efficient navigation to complete different tasks. Key findings are that actor-critic algorithms are widely used and provide the best performance in comparison to other method categories in multi-agent settings. Main limitations of MARL methods are how they can keep the results as good when moving from simulations to real-world applications. In real-world, agent observations are not perfect but instead subject to noisy measurements. The problem formulation also is very important, and it consists of state and action spaces available to agent and the reward structure. Further studies should be conducted on how MARL methods can be implemented into real-world applications.
dc.description.abstract	Vahvistusoppimisesta on tullut lupaava ratkaisu moniin tehtäviin, joita on vaikea ratkaista perinteisillä metodeilla ympäristön kompleksisuuden ja muuttuvuuden takia. Vahvistusoppiminen perustuu agentin toimien yrittämiseen ja siitä saatavaan palautteeseen ympäristöstä. Moniagenttinen vahvistusoppiminen laajentaa yksittäisagenttisten vahvistusoppimismetodien potentiaalia monirobottijärjestelmiin. Moniagenttisessa ympäristössä agentit voivat olla vuorovaikutuksessa toistensa kanssa tehden oppimisesta vaikeampaa. Moniagenttinen vahvistusoppimisen sovellusalueeseen kuuluu esimerkiksi mobiilirobotit tehdas logistiikassa ja miehittämättömien ilma-alus parvien kohdehakutehtävät. Tutkielma antaa lyhyen kuvauksen vahvistusoppimisen ja moni-robottijärjestelmien teoreettisesta taustasta. Kirjallisuuskatsaus osuus näyttää miten eri moniagentti vahvistusoppimismetodit saavuttavat koordinaatiota ja tehokasta navigointia eri tehtävien suorittamiseen. Tärkeimmät löydät ovat, että toimijakriitikko algoritmit ovat laajassa käytössä ja antavat parhaimman suorituskyvyn verrattuna muihin metodi kategorioihin moniagentti ympäristössä. Päärajoitus moniagenttisissa vahvistusoppimismetodeissa on se, että miten ne saavat pidettyä tulokset yhtä hyvinä, kun siirrytään simulaatioista todelliseen maailmaan. Todellisen maailman agentin havainnot eivät ole täydellisiä, mutta sen sijaan alttiita mittaushäiriöille. Tapa, jolla ongelma esitetään, on myös tärkeää ja se pitää sisällään tila- ja toiminta-avaruuden ja palkintorakenteen. Lisätutkimusta tarvitaan siitä, miten moniagentti vahvistusoppimismetodeja voidaan käyttää todellisen maailman sovelluksissa.
dc.format.extent	42
dc.identifier.uri	https://www.utupub.fi/handle/11111/61178
dc.identifier.urn	URN:NBN:fi-fe2026052756239
dc.language.iso	eng
dc.rights	fi=Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.\|en=This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.\|
dc.rights.accessrights	suljettu
dc.subject	Multi-agent reinforcement learning
dc.subject	multi-agent systems
dc.subject	deep reinforcement learning Moniagenttinen vahvistusoppiminen
dc.subject	moniagenttijärjestelmät
dc.subject	syvävahvistusoppiminen
dc.title	Reinforcement Learning Methods for Multi-Robot Systems
dc.type.ontasot	fi=Kandidaatintutkielma\|en=Bachelor's thesis\|

Tiedostot

Näytetään 1 - 1 / 1

Name:: Puotunen_Eetu_Thesis.pdf
Size:: 853.29 KB
Format:: Adobe Portable Document Format

Lataa

Kokoelmat

Kandidaatin tutkielmat (rajattu näkyvyys)