CRoSS : Une suite de simulation robotique continue pour un apprentissage par renforcement évolutif avec une grande diversité de tâches et une simulation physique réaliste

Image générée par Gemini AI
Des chercheurs ont mis au point le Continual Robotic Simulation Suite (CRoSS), une référence pour l'apprentissage par renforcement continu (CRL) utilisant des robots simulés sous Gazebo. Ce système comprend un robot à deux roues et un bras robotique à sept articulations, permettant d'exécuter une variété de tâches telles que le suivi de ligne et l'atteinte d'objectifs. CRoSS propose des variantes uniquement cinématiques pour une performance améliorée et inclut un environnement conteneurisé pour un accès facilité et une reproductibilité accrue, tout en mettant en avant des algorithmes standards d'apprentissage par renforcement. Cette suite vise à faire progresser la recherche en CRL en offrant un environnement de test réaliste et extensible.
La Nouvelle Suite de Références CRoSS Améliore l'Apprentissage par Renforcement Continu pour la Robotique
Une suite de références révolutionnaire appelée Continual Robotic Simulation Suite (CRoSS) a été introduite pour faire progresser l'apprentissage par renforcement continu (CRL) en abordant le défi des agents apprenant d'une séquence de tâches sans oublier les politiques acquises précédemment. Développée en utilisant le simulateur Gazebo, CRoSS facilite la recherche dans des environnements robotiques avec un réalisme physique élevé.
CRoSS utilise deux plateformes robotiques distinctes : un robot à deux roues à traction différentielle et un bras robotique à sept joints. Le robot à traction différentielle navigue à travers divers scénarios, y compris des tâches de suivi de ligne et de poussée d'objets, en utilisant des capteurs lidar, caméra et pare-chocs. Le bras robotique se concentre sur des tâches d'atteinte d'objectifs, offrant un contrôle cartésien de haut niveau et un contrôle des angles des joints à bas niveau. CRoSS introduit également des variantes uniquement cinématiques pour le bras robotique, permettant aux simulations de s'exécuter beaucoup plus rapidement lorsque les lectures de capteurs physiques ne sont pas nécessaires.
Extensibilité et Reproductibilité
CRoSS est conçu avec l'extensibilité à l'esprit, permettant aux chercheurs d'incorporer une large gamme de capteurs simulés dans leurs études. Pour améliorer la reproductibilité, la suite comprend une configuration conteneurisée utilisant Apptainer, garantissant que les utilisateurs peuvent exécuter la référence sans configuration extensive.
Les performances des algorithmes d'apprentissage par renforcement standard, tels que les Deep Q-Networks (DQN) et les méthodes de gradient de politique, ont été rapportées au sein de la suite, illustrant son efficacité en tant que référence évolutive pour la recherche en CRL. L'introduction de CRoSS représente une avancée significative dans le développement de systèmes d'apprentissage robotique sophistiqués.
Sujets connexes :
📰 Source originale : https://arxiv.org/abs/2602.04868v1
Tous les droits et crédits appartiennent à l'éditeur original.