Analyse domänenseitiger Optimierungen für Deep Reinforcement Learning in der RoboCup Umgebung
Analysis of domain-side optimizations for deep reinforcement learning in the RoboCup environment
- Mit dem Team "magmaOffenburg" nimmt die Hochschule Offenburg seit 2009 am internationalen Wettbewerb "RoboCup" in der 3D-Simulationsliga für Fußball teil. Dabei kommt es vor allem auf den Einsatz guter Lauf- und Kickverhalten an. Seit 2019 ist es dem Team magmaOffenburg möglich auch Deep Reinforcement Learning für die Weiterentwicklung der Verhalten einzusetzen. Während auf diese Weise schonMit dem Team "magmaOffenburg" nimmt die Hochschule Offenburg seit 2009 am internationalen Wettbewerb "RoboCup" in der 3D-Simulationsliga für Fußball teil. Dabei kommt es vor allem auf den Einsatz guter Lauf- und Kickverhalten an. Seit 2019 ist es dem Team magmaOffenburg möglich auch Deep Reinforcement Learning für die Weiterentwicklung der Verhalten einzusetzen. Während auf diese Weise schon verwendbare Ergebnisse für das Kicken produziert wurden, so fehlt noch ein Fortschritt beim Laufen lernen. Diese Arbeit beschäftigt sich mit den nötigen Optimierungen auf der Domänenseite, um das gelernte Laufen zu verbessern. Das beinhaltet die Optimierung des Observation- und Actionspaces, sowie auch eine Optimierung der Rewardfunktion. Dabei wurde versucht, die einzelnen Einflüsse verschiedener Parameter und Techniken innerhalb dieser drei Bereiche zu evaluieren. So konnte zum Schluss eine Verbesserung in der Laufgeschwindigkeit von etwas unter einem Meter pro Sekunde auf bis zu 1,8 Metern pro Sekunde erreicht werden. Ausschlaggebend für dieses Ergebnis waren vor allem der Verbesserungen in der Rewardfunktion.…
- With the team 'magmaOffenburg', the Offenburg University is participating in the international competition 'RoboCup' in the 3D simulation league for soccer since 2009. To archieve a great result, the team heavily relies on using well-trained behaviors for their agents (e.g. kicking or walking). Since 2019, magmaOffenburg is also able to use deep reinforcement learning in order to further developWith the team 'magmaOffenburg', the Offenburg University is participating in the international competition 'RoboCup' in the 3D simulation league for soccer since 2009. To archieve a great result, the team heavily relies on using well-trained behaviors for their agents (e.g. kicking or walking). Since 2019, magmaOffenburg is also able to use deep reinforcement learning in order to further develop their behaviors. Using deep reinforcement learning, the team was already able to score usable results in kicking. However, there is still a lack of progress for learning to walk. In this thesis, the required optimizations on the domain side were tested and evaluated in order to get a better result at walking. This includes optimizing the observation space as well as the action space. Furthermore, a lot of optimizations for the reward function will also be tested and evaluated. The goal was to get a clarification of the influence of the various parameters and the applied techniques on walking in the RoboCup domain. Finally, it was possible to improve the running speed from little under a meter per second to up to 1.8 meters per second. The main reason for this improvement were the optimizations in the reward function.…
Document Type: | Bachelor Thesis |
---|---|
Zitierlink: | https://opus.hs-offenburg.de/4682 | Bibliografische Angaben |
Title (German): | Analyse domänenseitiger Optimierungen für Deep Reinforcement Learning in der RoboCup Umgebung |
Title (English): | Analysis of domain-side optimizations for deep reinforcement learning in the RoboCup environment |
Author: | Hannes BraunStaff MemberGND |
Advisor: | Klaus Dorer, Stefan Wehr |
Year of Publication: | 2021 |
Publishing Institution: | Hochschule Offenburg |
Granting Institution: | Hochschule Offenburg |
Place of publication: | Offenburg |
Page Number: | vi, 78, vi |
URN: | https://urn:nbn:de:bsz:ofb1-opus4-46827 |
Language: | German | Inhaltliche Informationen |
Institutes: | Fakultät Elektrotechnik, Medizintechnik und Informatik (EMI) (ab 04/2019) |
Institutes: | Abschlussarbeiten / Bachelor-Studiengänge / AI |
Projekte / Magma Offenburg | |
Tag: | Laufen lernen Deep Reinforcement Learning RoboCup | Formale Angaben |
Open Access: | Open Access |
Licence (German): | Urheberrechtlich geschützt |
SWB-ID: | 1787293904 |