@phdthesis{Braun, type = {Bachelor Thesis}, author = {Hannes Braun}, title = {Analyse dom{\"a}nenseitiger Optimierungen f{\"u}r Deep Reinforcement Learning in der RoboCup Umgebung}, address = {Offenburg}, url = {https://nbn-resolving.org/urn:nbn:de:bsz:ofb1-opus4-46827}, pages = {vi, 78, vi}, abstract = {Mit dem Team \"magmaOffenburg\" nimmt die Hochschule Offenburg seit 2009 am internationalen Wettbewerb \"RoboCup\" in der 3D-Simulationsliga f{\"u}r Fu{\"s}ball teil. Dabei kommt es vor allem auf den Einsatz guter Lauf- und Kickverhalten an. Seit 2019 ist es dem Team magmaOffenburg m{\"o}glich auch Deep Reinforcement Learning f{\"u}r die Weiterentwicklung der Verhalten einzusetzen. W{\"a}hrend auf diese Weise schon verwendbare Ergebnisse f{\"u}r das Kicken produziert wurden, so fehlt noch ein Fortschritt beim Laufen lernen. Diese Arbeit besch{\"a}ftigt sich mit den n{\"o}tigen Optimierungen auf der Dom{\"a}nenseite, um das gelernte Laufen zu verbessern. Das beinhaltet die Optimierung des Observation- und Actionspaces, sowie auch eine Optimierung der Rewardfunktion. Dabei wurde versucht, die einzelnen Einfl{\"u}sse verschiedener Parameter und Techniken innerhalb dieser drei Bereiche zu evaluieren. So konnte zum Schluss eine Verbesserung in der Laufgeschwindigkeit von etwas unter einem Meter pro Sekunde auf bis zu 1,8 Metern pro Sekunde erreicht werden. Ausschlaggebend f{\"u}r dieses Ergebnis waren vor allem der Verbesserungen in der Rewardfunktion.}, language = {de} }