AI
Новости ИИ

Решение проблем избегания, устойчивых к параметрам, с неизвестной осуществимостью с использованием обучения с подкреплением

Source:arXiv
Оригинальный автор:Oswin So et al.
Решение проблем избегания, устойчивых к параметрам, с неизвестной осуществимостью с использованием обучения с подкреплением

Изображение создано Gemini AI

Недавние исследования представили метод, называемый FGE (Feasibility-Guided Exploration), который решает проблемы, связанные с применением глубокого обучения с подкреплением в задачах достижимости. FGE определяет допустимые начальные условия и разрабатывает безопасную политику, превосходя существующие методы более чем на 50% по охвату в сложных сценариях в симуляторах MuJoCo и Kinetix. Этот подход повышает уровень безопасности в задачах управления с высокой размерностью.

Достижения в области обучения с подкреплением решают проблемы устойчивости параметров

Недавние исследования представили новый метод, направленный на улучшение глубокого обучения с подкреплением (RL) в задачах достижимости — Исследование с учетом осуществимости (FGE). Этот метод повышает эффективность RL в средах с неизвестной осуществимостью.

FGE определяет подмножество осуществимых начальных условий для создания безопасной политики, одновременно обучаясь решать задачу достижимости в этом подмножестве. Этот двойной подход позволяет более всесторонне исследовать пространство состояний.

Эмпирические результаты

Эмпирические оценки показывают превосходство FGE над существующими методами. В экспериментах с симуляторами MuJoCo и Kinetix FGE достигла более чем на 50% большего охвата, чем конкурирующие подходы, подчеркивая его потенциал для повышения устойчивости RL-структур в сложных средах.

Связанные темы:

параметрическая устойчивостьобучение с подкреплениемдостижимостьИсследование с учётом осуществимостибезопасная политика

📰 Первоисточник: https://arxiv.org/abs/2602.15817v1

Все права и авторство принадлежат первоначальному издателю.

Поделиться статьей