AI
AI新闻

利用强化学习解决未知可行性下的参数鲁棒避碰问题

Source:arXiv
原作者:Oswin So et al.
利用强化学习解决未知可行性下的参数鲁棒避碰问题

Gemini AI生成的图像

近期研究提出了一种名为可行性导向探索(Feasibility-Guided Exploration, FGE)的方法,旨在解决深度强化学习在可达性问题上的局限性。FGE能够识别可行的初始条件,并学习出一种安全策略,在 MuJoCo 和 Kinetix 模拟器中,对于复杂场景的覆盖率比现有方法提高了超过50%。这一方法显著提高了高维控制任务的安全性。

强化学习的进展解决参数稳健性问题

近期的研究提出了一种新方法,即可行性引导探索(FGE),旨在提升深度强化学习(RL)在可达性问题上的表现。这种方法提高了RL在未知可行性环境中的有效性。

FGE识别出一组可行的初始条件,以便在学习解决该子集中的可达性问题时建立安全策略。这种双重方法使得状态空间的探索更加全面。

实证结果

实证评估显示FGE优于现有方法。在与MuJoCo和Kinetix模拟器的实验中,FGE的覆盖率比竞争方法高出50%以上,突显了其在复杂环境中增强RL框架稳健性的潜力。

相关主题:

强化学习可达性问题鲁棒优化可行性引导探索MuJoCo模拟器

📰 原始来源: https://arxiv.org/abs/2602.15817v1

所有权利和署名均属于原出版商。

分享此文章