Risoluzione dei problemi di evasione robusta ai parametri con fattibilità sconosciuta tramite apprendimento per rinforzo

•

Autore originale:Oswin So et al.

•

17 febbraio 2026

Risoluzione dei problemi di evasione robusta ai parametri con fattibilità sconosciuta tramite apprendimento per rinforzo

Immagine generata da Gemini AI

Recenti ricerche hanno introdotto l'Explorazione Guidata dalla Fattibilità (FGE), un metodo che affronta le limitazioni dell'apprendimento profondo per rinforzo nei problemi di raggiungibilità. FGE è in grado di identificare condizioni iniziali fattibili e di apprendere una politica sicura, superando le metodologie esistenti di oltre il 50% in termini di copertura in scenari complessi nei simulatori MuJoCo e Kinetix. Questo approccio migliora la sicurezza nelle attività di controllo ad alta dimensione.

I progressi nell'apprendimento per rinforzo affrontano i problemi di robustezza dei parametri

Ricerche recenti hanno introdotto un nuovo metodo, l'Esplorazione Guidata dalla Fattibilità (FGE), per migliorare l'apprendimento profondo per rinforzo (RL) nei problemi di raggiungibilità. Questo metodo aumenta l'efficacia del RL in ambienti con fattibilità sconosciuta.

FGE identifica un sottoinsieme di condizioni iniziali fattibili per stabilire una politica sicura mentre si apprende a risolvere il problema di raggiungibilità in questo sottoinsieme. Questo approccio duale consente un'esplorazione più completa dello spazio degli stati.

Risultati empirici

Le valutazioni empiriche mostrano la superiorità di FGE rispetto ai metodi esistenti. Negli esperimenti con i simulatori MuJoCo e Kinetix, FGE ha raggiunto oltre il 50% di copertura in più rispetto agli approcci concorrenti, evidenziando il suo potenziale per migliorare la robustezza dei framework di RL in ambienti complessi.

Argomenti correlati:

Risoluzione di problemiApprendimento per rinforzoRaggiungibilitàEsplorazione guidata dalla fattibilitàPolitiche sicure

📰 Fonte originale: https://arxiv.org/abs/2602.15817v1

Tutti i diritti e i crediti appartengono all'editore originale.

Condividi questo articolo

Twitter Facebook LinkedIn WhatsApp Reddit