AI
Notizie IA

DynaWeb: Apprendimento per rinforzo basato su modelli per agenti web

Source:arXiv
Autore originale:Hang Ding et al.
DynaWeb: Apprendimento per rinforzo basato su modelli per agenti web

Immagine generata da Gemini AI

DynaWeb è un nuovo framework di apprendimento per rinforzo basato su modelli, progettato per addestrare agenti web autonomi utilizzando un ambiente web simulato. Prevedendo le rappresentazioni delle pagine web in base alle azioni degli agenti, consente un addestramento efficiente senza i rischi associati all'interazione in tempo reale con Internet. Gli esperimenti dimostrano che DynaWeb migliora le prestazioni dei modelli di agenti web esistenti su benchmark come WebArena, offrendo un approccio scalabile all'apprendimento per rinforzo online.

DynaWeb: Un'Innovazione nella Formazione di Agenti Web Autonomi

DynaWeb segna un importante progresso nello sviluppo di agenti web autonomi alimentati da Modelli di Linguaggio di Grandi Dimensioni (LLM) e apprendimento per rinforzo (RL). Questo framework di apprendimento per rinforzo basato su modelli (MBRL) affronta le sfide associate alla formazione di agenti in ambienti internet in tempo reale.

DynaWeb utilizza un modello del mondo per simulare interazioni all'interno di un ambiente web sintetico, consentendo agli agenti web di "sognare" e generare ampie traiettorie di azione per un miglioramento dell'apprendimento online per rinforzo. Predicendo le modifiche delle pagine web in base alle azioni degli agenti, DynaWeb crea uno spazio controllato per consentire agli agenti di perfezionare le loro politiche.

Caratteristiche del Framework

Le caratteristiche di DynaWeb includono:

  • Apprendimento del Modello del Mondo: Predice le modifiche delle pagine web in risposta alle azioni degli agenti.
  • Rollout delle Politiche: Genera enormi quantità di traiettorie di rollout.
  • Integrazione delle Traiettorie di Esperti: Combina traiettorie reali di esperti con rollout generati dagli agenti per una formazione migliorata.

Validazione delle Prestazioni

Esperimenti sui benchmark WebArena e WebVoyager dimostrano che DynaWeb supera significativamente i modelli di agenti web open-source attuali, evidenziando il potenziale del framework di rimodellare la formazione degli agenti web.

Argomenti correlati:

DynaWebapprendimento per rinforzomodelli linguistici di grandi dimensioniagenti web autonomiambiente web sintetico

📰 Fonte originale: https://arxiv.org/abs/2601.22149v1

Tutti i diritti e i crediti appartengono all'editore originale.

Condividi questo articolo