CRoSS: Eine kontinuierliche robotische Simulationssuite für skalierbares Reinforcement Learning mit hoher Aufgabenvielfalt und realistischer Physiksimulation

Von Gemini AI generiertes Bild
Forscher haben das Continual Robotic Simulation Suite (CRoSS) entwickelt, einen Benchmark für kontinuierliches Reinforcement Learning (CRL), der auf in Gazebo simulierten Robotern basiert. Er beinhaltet einen zweirädrigen Roboter sowie einen siebenarmigen Roboterarm, die eine Vielzahl von Aufgaben wie Linienverfolgung und Zielerreichung ermöglichen. CRoSS bietet Varianten, die sich ausschließlich auf die Kinematik konzentrieren, um schnellere Ergebnisse zu erzielen, und umfasst ein containerisiertes Setup, das einfachen Zugang und Reproduzierbarkeit gewährleistet. Dabei werden gängige RL-Algorithmen präsentiert. Dieses Suite zielt darauf ab, die Forschung im Bereich des kontinuierlichen Reinforcement Learning zu fördern, indem sie eine realistische und erweiterbare Testumgebung bereitstellt.
Neue Benchmark-Suite CRoSS verbessert kontinuierliches Verstärkungslernen für Robotik
Eine bahnbrechende Benchmark-Suite namens Continual Robotic Simulation Suite (CRoSS) wurde eingeführt, um das kontinuierliche Verstärkungslernen (CRL) voranzutreiben, indem sie die Herausforderung angeht, dass Agenten aus einer Abfolge von Aufgaben lernen, ohne zuvor erworbene Strategien zu vergessen. Entwickelt mit dem Gazebo-Simulator, ermöglicht CRoSS Forschungen in robotischen Umgebungen mit hoher physikalischer Realität.
CRoSS nutzt zwei unterschiedliche robotische Plattformen: einen zweirädrigen Differentialantriebsroboter und einen siebenachser Roboterarm. Der Differentialantriebsroboter navigiert durch verschiedene Szenarien, einschließlich Linienfolgen und Objektverschieben, und verwendet dabei Lidar-, Kamera- und Stoßsensoren. Der Roboterarm konzentriert sich auf Zielerreichungsaufgaben und bietet eine hochgradige kartesische Steuerung sowie eine niedriggradige Gelenkwinkelsteuerung. CRoSS führt auch kinematische Varianten nur für den Roboterarm ein, die es ermöglichen, Simulationen erheblich schneller auszuführen, wenn physikalische Sensordaten nicht erforderlich sind.
Erweiterbarkeit und Reproduzierbarkeit
CRoSS wurde mit dem Gedanken an Erweiterbarkeit entwickelt, sodass Forscher eine Vielzahl von simulierten Sensoren in ihre Studien integrieren können. Um die Reproduzierbarkeit zu verbessern, umfasst die Suite ein containerisiertes Setup mit Apptainer, sodass die Benutzer die Benchmark ohne umfangreiche Konfiguration ausführen können.
Die Leistung standardmäßiger Verstärkungslernalgorithmen, wie z.B. Deep Q-Networks (DQN) und Policy-Gradient-Methoden, wurde innerhalb der Suite dokumentiert, was ihre Wirksamkeit als skalierbare Benchmark für CRL-Forschung veranschaulicht. Die Einführung von CRoSS stellt einen bedeutenden Schritt in der Entwicklung anspruchsvoller robotischer Lernsysteme dar.
Verwandte Themen:
📰 Originalquelle: https://arxiv.org/abs/2602.04868v1
Alle Rechte und Urheberrechte liegen beim ursprünglichen Herausgeber.