AI
Actualités IA

Résolution de problèmes d'évitement robustes aux paramètres avec des faisabilités inconnues grâce à l'apprentissage par renforcement

Source:arXiv
Auteur original:Oswin So et al.
Résolution de problèmes d'évitement robustes aux paramètres avec des faisabilités inconnues grâce à l'apprentissage par renforcement

Image générée par Gemini AI

Des recherches récentes présentent l'Exploration Guidée par la Faisabilité (EGF), une méthode qui répond aux limites de l'apprentissage par renforcement profond dans les problèmes de reachabilité. L'EGF identifie des conditions initiales réalisables et apprend une politique sûre, surpassant les méthodes existantes de plus de 50 % en termes de couverture dans des scénarios complexes dans les simulateurs MuJoCo et Kinetix. Cette approche améliore la sécurité dans les tâches de contrôle à haute dimension.

Les avancées en apprentissage par renforcement répondent aux problèmes d'évitement robustes aux paramètres

Des recherches récentes ont introduit une méthode novatrice, l'Exploration Guidée par la Faisabilité (FGE), pour améliorer l'apprentissage par renforcement profond (RL) dans les problèmes de atteignabilité. Cette méthode accroît l'efficacité du RL dans des environnements dont la faisabilité est inconnue.

La FGE identifie un sous-ensemble de conditions initiales faisables pour établir une politique sûre tout en apprenant à résoudre le problème d'atteignabilité dans ce sous-ensemble. Cette approche duale permet une exploration plus complète de l'espace d'état.

Résultats Empiriques

Les évaluations empiriques montrent la supériorité de la FGE par rapport aux méthodes existantes. Lors d'expérimentations avec les simulateurs MuJoCo et Kinetix, la FGE a atteint plus de 50 % de couverture en plus que les approches concurrentes, soulignant son potentiel à améliorer la robustesse des cadres de RL dans des environnements complexes.

Sujets connexes :

apprentissage par renforcementproblèmes de reachabilitéoptimisation robusteExploration Guidée par la Faisabilitépolitiques sûres

📰 Source originale : https://arxiv.org/abs/2602.15817v1

Tous les droits et crédits appartiennent à l'éditeur original.

Partager cet article