AI
KI-Nachrichten

Koordination durch Quantenverschränkung im Multi-Agenten-Verstärkungslernen erlernen

Source:arXiv
Originalautor:John Gardiner et al.
Koordination durch Quantenverschränkung im Multi-Agenten-Verstärkungslernen erlernen

Von Gemini AI generiertes Bild

Ein neues Framework für das Multi-Agenten-Verstärkendes Lernen (MARL) nutzt gemeinsame Quantenverschränkung, um die Koordination ohne Kommunikation zu verbessern und übertrifft dabei frühere Methoden, die auf gemeinsamer Zufälligkeit basierten. Dieser Ansatz führt eine differenzierbare Parameterisierung der Politik ein und entwickelt eine neuartige Architektur, die die Quantenkoordination von der lokalen Entscheidungsfindung trennt. Die Ergebnisse zeigen, dass Strategien, die einen quantenmechanischen Vorteil erzielen, sowohl in einrundigen kooperativen Spielen als auch in dezentralen, teilweise beobachtbaren Markov-Entscheidungsprozessen (Dec-POMDPs) signifikante Fortschritte in der Leistung von MARL ermöglichen.

Neues Framework Nutzt Quantenverschränkung zur Koordination in der Multi-Agenten-Verstärkungslernen

Ein bahnbrechender Ansatz im Bereich des Multi-Agenten-Verstärkungslernens (MARL) nutzt Quantenverschränkung, um die Koordination zwischen Agenten ohne direkte Kommunikation zu verbessern. Dies ist das erste Framework, das es MARL-Agenten ermöglicht, gemeinsame Quantenverschränkung zu nutzen, um effektivere korrelierte Politiken zu entwickeln als die, die durch traditionelle gemeinsame Zufälligkeit erreicht werden können.

Forschungen zeigen, dass in bestimmten kooperativen Spielen, die Kommunikation verbieten, Strategien, die auf geteilter Quantenverschränkung basieren, diejenigen übertreffen können, die ausschließlich auf geteilter Zufälligkeit beruhen. Das Framework integriert eine neuartige differenzierbare Politikparameterisierung und eine Architektur, die darauf ausgelegt ist, gemeinsame Politiken in einen Quantenkoordinator und dezentralisierte lokale Akteure zu unterteilen.

Das neue Framework ermöglicht die Optimierung über Quantenmessungen, sodass Agenten Strategien erlernen können, die einen quantenmechanischen Vorteil in Einzelrunden-Spielen erzielen. Die Forscher demonstrierten diese Fähigkeit mithilfe von Black-Box-Orakeln, um zu veranschaulichen, wie Agenten effektive Strategien erlernen können, ohne bereits bestehende Kommunikationsprotokolle.

Verwandte Themen:

QuantenverschränkungMulti-Agenten-Verstärkungslernendezentrale Entscheidungsfindungquantenmechanischer Vorteilsequentielle Entscheidungsfindung

📰 Originalquelle: https://arxiv.org/abs/2602.08965v1

Alle Rechte und Urheberrechte liegen beim ursprünglichen Herausgeber.

Artikel teilen