通过量子纠缠在多智能体强化学习中学习协调能力

•

原作者:John Gardiner et al.

•

2026年2月9日

Gemini AI生成的图像

一种新的多智能体强化学习（MARL）框架利用共享量子纠缠来增强智能体之间的协调能力，而无需进行通信，这一方法超越了以往依赖共享随机性的技术。该框架引入了可微分的策略参数化和一种新颖的架构，将量子协调与本地决策过程分开。研究结果表明，在单轮合作游戏和分散部分可观测马尔可夫决策过程（Dec-POMDPs）中，该策略展示了量子优势，暗示着MARL性能的显著提升。

新框架利用量子纠缠实现多智能体强化学习中的协调

一种在多智能体强化学习（MARL）领域的开创性方法利用量子纠缠来增强智能体之间的协调，而无需直接通信。这是第一个允许MARL智能体利用共享量子纠缠来开发比传统共享随机性更有效的相关策略的框架。

研究表明，在某些禁止通信的合作游戏中，利用共享量子纠缠的策略可以优于仅基于共享随机性的策略。该框架集成了一种新颖的可微分策略参数化方法，以及一个旨在将联合策略分离为量子协调者和去中心化本地行动者的架构。

这个新框架使得在量子测量上进行优化成为可能，允许智能体学习在单轮游戏中实现量子优势的策略。研究人员通过使用黑箱预言机展示了这一能力，说明智能体如何在没有现成通信协议的情况下学习有效策略。

分享此文章

Twitter Facebook LinkedIn WhatsApp Reddit

通过量子纠缠在多智能体强化学习中学习协调能力

新框架利用量子纠缠实现多智能体强化学习中的协调

相关主题：

分享此文章