CRoSS: Una Suite di Simulazione Robotica Continua per l'Apprendimento per Rinforzo Scalabile con Alta Diversità di Compiti e Simulazione Fisica Realistica

Immagine generata da Gemini AI
I ricercatori hanno sviluppato il Continual Robotic Simulation Suite (CRoSS), un benchmark per il reinforcement learning continuo (CRL) utilizzando robot simulati in Gazebo. Il suite comprende un robot a due ruote e un braccio robotico a sette giunti, capaci di svolgere una varietà di compiti come seguire linee e raggiungere obiettivi. CRoSS offre varianti basate esclusivamente sulla cinematica per migliorare le prestazioni e include un setup containerizzato per facilitare l'accesso e la riproducibilità, presentando algoritmi standard di RL. Questo strumento si propone di potenziare la ricerca nel CRL offrendo un ambiente di test realistico ed estensibile.
Il Nuovo Pacchetto di Benchmark CRoSS Migliora l'Apprendimento per Rinforzo Continuo nella Robotica
È stato introdotto un pacchetto di benchmark innovativo chiamato Continual Robotic Simulation Suite (CRoSS) per promuovere l'apprendimento per rinforzo continuo (CRL) affrontando la sfida degli agenti che apprendono da una sequenza di compiti senza dimenticare le politiche acquisite in precedenza. Sviluppato utilizzando il simulatore Gazebo, CRoSS facilita la ricerca in ambienti robotici con un alto realismo fisico.
CRoSS utilizza due piattaforme robotiche distinte: un robot a due ruote con trazione differenziale e un braccio robotico a sette giunti. Il robot a trazione differenziale naviga in vari scenari, inclusi compiti di seguire una linea e spingere oggetti, utilizzando sensori lidar, telecamera e paraurti. Il braccio robotico si concentra su compiti di raggiungimento di obiettivi, offrendo controllo cartesiano di alto livello e controllo angolare del giunto di basso livello. CRoSS introduce anche varianti solo cinematiche per il braccio robotico, consentendo simulazioni significativamente più veloci quando non sono necessarie letture da sensori fisici.
Estensibilità e Riproducibilità
CRoSS è progettato tenendo a mente l'estensibilità, permettendo ai ricercatori di incorporare una vasta gamma di sensori simulati nei loro studi. Per migliorare la riproducibilità, il pacchetto include una configurazione containerizzata usando Apptainer, assicurando che gli utenti possano eseguire il benchmark senza configurazioni estensive.
Le prestazioni degli algoritmi standard di apprendimento per rinforzo, come i Deep Q-Networks (DQN) e i metodi di gradiente di politica, sono state riportate all'interno del pacchetto, illustrando la sua efficacia come benchmark scalabile per la ricerca CRL. L'introduzione di CRoSS segna un passo significativo avanti nello sviluppo di sistemi robotici di apprendimento sofisticati.
Argomenti correlati:
📰 Fonte originale: https://arxiv.org/abs/2602.04868v1
Tutti i diritti e i crediti appartengono all'editore originale.