Aprendizado de Coordenação por Meio do Emaranhamento Quântico em Aprendizado por Reforço Multiagente

Imagem gerada por Gemini AI
Um novo framework para aprendizado por reforço multiagente (MARL) utiliza o entrelaçamento quântico compartilhado para melhorar a coordenação sem comunicação, superando métodos anteriores que dependiam de aleatoriedade compartilhada. Essa abordagem apresenta uma parametrização de política diferenciável e uma arquitetura inovadora que separa a coordenação quântica da tomada de decisões local. Os resultados demonstram estratégias que alcançam vantagem quântica tanto em jogos cooperativos de uma única rodada quanto em processos de decisão de Markov parcialmente observáveis descentralizados (Dec-POMDPs), sugerindo avanços significativos no desempenho do MARL.
Novo Framework Utiliza Entrelaçamento Quântico para Coordenação em Aprendizado por Reforço Multi-Agente
Uma abordagem inovadora no aprendizado por reforço multi-agente (MARL) aproveita o entrelaçamento quântico para melhorar a coordenação entre agentes sem comunicação direta. Este é o primeiro framework que permite que agentes MARL explorem o entrelaçamento quântico compartilhado para desenvolver políticas correlacionadas mais eficazes do que aquelas alcançáveis por meio da aleatoriedade compartilhada tradicional.
Pesquisas indicam que, para certos jogos cooperativos que proíbem a comunicação, estratégias que utilizam o entrelaçamento quântico compartilhado podem superar aquelas baseadas apenas na aleatoriedade compartilhada. O framework integra uma nova parametrização de políticas diferenciáveis e uma arquitetura projetada para separar políticas conjuntas em um coordenador quântico e atores locais descentralizados.
O novo framework permite a otimização sobre medições quânticas, permitindo que os agentes aprendam estratégias que alcançam vantagem quântica em jogos de uma única rodada. Os pesquisadores demonstraram essa capacidade usando oráculos de caixa preta para ilustrar como os agentes podem aprender estratégias eficazes sem protocolos de comunicação pré-existentes.
Tópicos relacionados:
📰 Fonte original: https://arxiv.org/abs/2602.08965v1
Todos os direitos e créditos pertencem ao editor original.