AI
KI-Nachrichten

Multi-Objective Verstärkendes Lernen zur effizienten taktischen Entscheidungsfindung für Lkw im Autobahnverkehr

Source:arXiv
Originalautor:Deepthi Pathare et al.
Multi-Objective Verstärkendes Lernen zur effizienten taktischen Entscheidungsfindung für Lkw im Autobahnverkehr

Von Gemini AI generiertes Bild

Ein neues multi-zielgerichtetes Verstärkungslern-Framework, das auf der Proximal Policy Optimization basiert, behandelt die komplexen Abwägungen beim Fahren auf Autobahnen mit schweren Nutzfahrzeugen. Es balanciert Sicherheit, Energieeffizienz und Zeitersparnis. Das System generiert eine kontinuierliche Reihe von Pareto-optimalen Politiken, die flexible Anpassungen des Fahrverhaltens ohne erneutes Training ermöglichen. Dieser anpassungsfähige Ansatz verbessert die Entscheidungsfindung für autonomes Fahren im Güterverkehr und wurde auf einer skalierbaren Simulationsplattform evaluiert.

Neues Multi-Objective Reinforcement Learning Framework verbessert die Entscheidungsfindung für Lkw auf Autobahnen

Ein kürzliches Fortschritt im Bereich des Multi-Objective Reinforcement Learning präsentiert ein neuartiges Framework, das darauf ausgelegt ist, die Entscheidungsfindung für schwere Lkw im Autobahnverkehr zu optimieren. Dieser Ansatz adressiert den Balanceakt zwischen Sicherheit, Energieeffizienz und Betriebskosten, der für autonome Fahrzeuge eine Herausforderung darstellt.

Forscher haben ein auf Proximal Policy Optimization (PPO) basierendes System entwickelt, das ein kontinuierliches Spektrum von Politiken erzeugt, die die Trade-offs zwischen konkurrierenden Zielen darstellen. Das Framework wurde auf einer skalierbaren Simulationsplattform getestet und zeigt sein Potenzial für Anwendungen in der realen Welt.

Hauptmerkmale des Frameworks

Das vorgeschlagene Framework konzentriert sich auf drei Hauptziele:

  • Sicherheit: Gemessen durch die Häufigkeit von Kollisionen und erfolgreichen Fahraufgaben.
  • Energieeffizienz: Bewertet durch die während des Betriebs anfallenden Energiekosten.
  • Zeit-Effizienz: Bewertet basierend auf den Kosten, die mit der Zeit des Fahrers verbunden sind.

Dieser Ansatz führt zu einer glatten und interpretierbaren Pareto-Front, die eine flexible Entscheidungsfindung auf der Grundlage variierender Prioritäten zwischen widersprüchlichen Zielen ermöglicht.

Auswirkungen auf das autonome Fahren von Lkw

Die Auswirkungen dieses Frameworks sind erheblich für das autonome Fahren von Lkw und verbessern die Betriebseffizienz sowie die Sicherheit bei der Einführung autonomer schwerer Fahrzeuge.

Verwandte Themen:

Multi-Objective Reinforcement LearningProximal Policy Optimizationtaktische EntscheidungsfindungPareto-optimalen PolitikenSicherheits- und Effizienzabgleich

📰 Originalquelle: https://arxiv.org/abs/2601.18783v1

Alle Rechte und Urheberrechte liegen beim ursprünglichen Herausgeber.

Artikel teilen