CRoSS:一种可持续机器人仿真套件,支持高任务多样性和真实物理仿真的可扩展强化学习

Gemini AI生成的图像
研究人员开发了持续机器人模拟套件(CRoSS),这是一个基于Gazebo模拟机器人进行持续强化学习(CRL)的基准测试平台。该平台包含一个双轮机器人和一个七关节机械臂,可支持多种任务,如循迹和目标到达。CRoSS提供了仅基于运动学的变体,以实现更快的性能,并包括一个容器化的设置,方便用户访问和复现,展示了标准的强化学习算法。该套件旨在通过提供一个真实且可扩展的测试环境,推动持续强化学习的研究进展。
新基准套件CRoSS增强了机器人领域的持续强化学习
一款名为持续机器人仿真套件(CRoSS)的开创性基准套件已被推出,旨在通过解决代理在学习一系列任务时不会遗忘先前获得的策略的挑战,推动持续强化学习(CRL)的发展。CRoSS采用Gazebo仿真器开发,促进了具有高度物理现实感的机器人环境中的研究。
CRoSS使用了两种不同的机器人平台:一款双轮差分驱动机器人和一款七关节机器人手臂。差分驱动机器人通过激光雷达、摄像头和碰撞传感器在各种场景中进行导航,包括跟踪线路和推物体任务。机器人手臂则专注于目标达成任务,提供高水平的笛卡尔控制和低水平的关节角度控制。CRoSS还为机器人手臂引入了仅运动学变体,使得在不需要物理传感器读数的情况下,仿真运行速度显著提升。
可扩展性和可重复性
CRoSS的设计考虑了可扩展性,允许研究人员将各种模拟传感器纳入他们的研究中。为增强可重复性,该套件包括使用Apptainer的容器化设置,确保用户能够在无需大量配置的情况下运行基准测试。
基准套件中已报告了标准强化学习算法的性能,如深度Q网络(DQN)和策略梯度方法,说明其作为CRL研究的可扩展基准的有效性。CRoSS的推出标志着复杂机器人学习系统发展的重要一步。
相关主题:
📰 原始来源: https://arxiv.org/abs/2602.04868v1
所有权利和署名均属于原出版商。