Решение проблем избегания, устойчивых к параметрам, с неизвестной осуществимостью с использованием обучения с подкреплением

Изображение создано Gemini AI
Недавние исследования представили метод, называемый FGE (Feasibility-Guided Exploration), который решает проблемы, связанные с применением глубокого обучения с подкреплением в задачах достижимости. FGE определяет допустимые начальные условия и разрабатывает безопасную политику, превосходя существующие методы более чем на 50% по охвату в сложных сценариях в симуляторах MuJoCo и Kinetix. Этот подход повышает уровень безопасности в задачах управления с высокой размерностью.
Достижения в области обучения с подкреплением решают проблемы устойчивости параметров
Недавние исследования представили новый метод, направленный на улучшение глубокого обучения с подкреплением (RL) в задачах достижимости — Исследование с учетом осуществимости (FGE). Этот метод повышает эффективность RL в средах с неизвестной осуществимостью.
FGE определяет подмножество осуществимых начальных условий для создания безопасной политики, одновременно обучаясь решать задачу достижимости в этом подмножестве. Этот двойной подход позволяет более всесторонне исследовать пространство состояний.
Эмпирические результаты
Эмпирические оценки показывают превосходство FGE над существующими методами. В экспериментах с симуляторами MuJoCo и Kinetix FGE достигла более чем на 50% большего охвата, чем конкурирующие подходы, подчеркивая его потенциал для повышения устойчивости RL-структур в сложных средах.
Связанные темы:
📰 Первоисточник: https://arxiv.org/abs/2602.15817v1
Все права и авторство принадлежат первоначальному издателю.