IRL-DAL: Pianificazione di Traiettorie Sicure e Adaptive per la Guida Autonoma tramite Modelli di Diffusione Guidati dall'Energia

Immagine generata da Gemini AI
Un nuovo framework, IRL-DAL, migliora la navigazione dei veicoli autonomi grazie a un pianificatore adattivo basato sulla diffusione. Il sistema inizia con l'apprendimento per imitazione da un controller FSM esperto, integrando il feedback ambientale e le ricompense dell'IRL. Questo approccio raggiunge un tasso di successo del 96% e riduce le collisioni a 0,05 ogni 1.000 passi, migliorando notevolmente la sicurezza. Il codice è disponibile pubblicamente per ulteriori ricerche.
Il Framework IRL-DAL Migliora la Navigazione dei Veicoli Autonomi
Un nuovo framework di apprendimento per rinforzo inverso chiamato IRL-DAL è pronto per avanzare la sicurezza e l'adattabilità della pianificazione delle traiettorie nei veicoli autonomi. Il sistema raggiunge un tasso di successo del 96% e riduce drasticamente gli incidenti a sole 0,05 ogni 1.000 passi.
Il framework IRL-DAL inizia l'addestramento attraverso l'imitazione di un controller esperto a macchina a stati finiti (FSM), integrando il feedback ambientale con un segnale discriminatore di apprendimento per rinforzo inverso (IRL). Dopo questa fase, il sistema subisce un apprendimento per rinforzo (RL) utilizzando una struttura di ricompensa ibrida che combina intuizioni ambientali con incentivi IRL mirati.
Un componente cruciale è un modello di diffusione condizionale, che funge da supervisore della sicurezza per pianificare percorsi di guida sicuri e mantenere la disciplina di corsia. Inoltre, una maschera adattativa apprendibile (LAM) migliora la percezione del veicolo regolando l'attenzione visiva in base alla velocità e alla vicinanza ai pericoli.
Dopo la fase di imitazione iniziale, la politica di guida viene affinata utilizzando l'Ottimizzazione della Politica Prossimale (PPO), con l'addestramento che avviene all'interno del simulatore Webots.
IRL-DAL naviga abilmente in ambienti pericolosi, dimostrando una gestione esperta di condizioni di guida complesse. Il team di ricerca ha reso disponibile pubblicamente il codice del framework per incoraggiare ulteriori sviluppi nella guida autonoma.
Argomenti correlati:
📰 Fonte originale: https://arxiv.org/abs/2601.23266v1
Tutti i diritti e i crediti appartengono all'editore originale.