Reinforcement Learning Methods for Multi-Robot Systems

dc.contributor.authorPuotunen, Eetu
dc.contributor.departmentfi=Kone- ja materiaalitekniikan laitos|en=Department of Mechanical and Materials Engineering|
dc.contributor.facultyfi=Teknillinen tiedekunta|en=Faculty of Technology|
dc.contributor.studysubjectfi=Konetekniikka|en=Mechanical Engineering|
dc.date.accessioned2026-05-27T19:01:46Z
dc.date.issued2026-05-19
dc.description.abstractReinforcement learning has become promising solution to many tasks that are hard to solve with conventional methods due to complex and dynamic environments. Reinforcement learning is based on agent trying actions and getting feedback from the environment. Multi-agent reinforcement learning (MARL) expands the potential of single-agent reinforcement learning methods to multi-robot system. In multi-agent settings, agents can interact with each other making learning more difficult. MARL application areas include for example mobile-robot fleets in warehouse logistics and UAV swarms for target search task. The thesis provides brief theoretical background of reinforcement learning and multi-robot systems. Literature review section shows, how different MARL methods achieve coordination and efficient navigation to complete different tasks. Key findings are that actor-critic algorithms are widely used and provide the best performance in comparison to other method categories in multi-agent settings. Main limitations of MARL methods are how they can keep the results as good when moving from simulations to real-world applications. In real-world, agent observations are not perfect but instead subject to noisy measurements. The problem formulation also is very important, and it consists of state and action spaces available to agent and the reward structure. Further studies should be conducted on how MARL methods can be implemented into real-world applications.
dc.description.abstractVahvistusoppimisesta on tullut lupaava ratkaisu moniin tehtäviin, joita on vaikea ratkaista perinteisillä metodeilla ympäristön kompleksisuuden ja muuttuvuuden takia. Vahvistusoppiminen perustuu agentin toimien yrittämiseen ja siitä saatavaan palautteeseen ympäristöstä. Moniagenttinen vahvistusoppiminen laajentaa yksittäisagenttisten vahvistusoppimismetodien potentiaalia monirobottijärjestelmiin. Moniagenttisessa ympäristössä agentit voivat olla vuorovaikutuksessa toistensa kanssa tehden oppimisesta vaikeampaa. Moniagenttinen vahvistusoppimisen sovellusalueeseen kuuluu esimerkiksi mobiilirobotit tehdas logistiikassa ja miehittämättömien ilma-alus parvien kohdehakutehtävät. Tutkielma antaa lyhyen kuvauksen vahvistusoppimisen ja moni-robottijärjestelmien teoreettisesta taustasta. Kirjallisuuskatsaus osuus näyttää miten eri moniagentti vahvistusoppimismetodit saavuttavat koordinaatiota ja tehokasta navigointia eri tehtävien suorittamiseen. Tärkeimmät löydät ovat, että toimijakriitikko algoritmit ovat laajassa käytössä ja antavat parhaimman suorituskyvyn verrattuna muihin metodi kategorioihin moniagentti ympäristössä. Päärajoitus moniagenttisissa vahvistusoppimismetodeissa on se, että miten ne saavat pidettyä tulokset yhtä hyvinä, kun siirrytään simulaatioista todelliseen maailmaan. Todellisen maailman agentin havainnot eivät ole täydellisiä, mutta sen sijaan alttiita mittaushäiriöille. Tapa, jolla ongelma esitetään, on myös tärkeää ja se pitää sisällään tila- ja toiminta-avaruuden ja palkintorakenteen. Lisätutkimusta tarvitaan siitä, miten moniagentti vahvistusoppimismetodeja voidaan käyttää todellisen maailman sovelluksissa.
dc.format.extent42
dc.identifier.urihttps://www.utupub.fi/handle/11111/61178
dc.identifier.urnURN:NBN:fi-fe2026052756239
dc.language.isoeng
dc.rightsfi=Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.|en=This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.|
dc.rights.accessrightssuljettu
dc.subjectMulti-agent reinforcement learning
dc.subjectmulti-agent systems
dc.subjectdeep reinforcement learning Moniagenttinen vahvistusoppiminen
dc.subjectmoniagenttijärjestelmät
dc.subjectsyvävahvistusoppiminen
dc.titleReinforcement Learning Methods for Multi-Robot Systems
dc.type.ontasotfi=Kandidaatintutkielma|en=Bachelor's thesis|

Tiedostot

Näytetään 1 - 1 / 1
Ladataan...
Name:
Puotunen_Eetu_Thesis.pdf
Size:
853.29 KB
Format:
Adobe Portable Document Format