AI
KI-Nachrichten

GaMO: Geometriebewusste Mehransichts-Diffusionsausmalung für spärliche 3D-Rekonstruktion

Source:arXiv
Originalautor:Yi-Chuan Huang et al.
GaMO: Geometriebewusste Mehransichts-Diffusionsausmalung für spärliche 3D-Rekonstruktion

Von Gemini AI generiertes Bild

Jüngste Fortschritte in der 3D-Rekonstruktion mit GaMO (Geometry-aware Multi-view Outpainter) überwinden die Einschränkungen bestehender Methoden, die bei begrenzten Eingabeperspektiven Schwierigkeiten haben. Durch die Erweiterung des Sichtfelds über die aktuellen Kamerapositionen hinweg sorgt GaMO für geometrische Konsistenz und verbessert die Szenenabdeckung. In Tests auf den Datensätzen Replica und ScanNet++ erzielte es eine überlegene Rekonstruktionsqualität und eine 25-fache Beschleunigung im Vergleich zu führenden Diffusionsmethoden, wobei die Verarbeitung innerhalb von 10 Minuten erfolgte. Für weitere Informationen besuchen Sie bitte die Projektseite: https://yichuanh.github.io/GaMO/.

GaMO revolutioniert die 3D-Rekonstruktion mit geometrie-bewusstem Multi-View-Diffusions-Outpainting

Forscher haben GaMO (Geometrie-bewusster Multi-View-Outpainter) vorgestellt, ein Framework, das die 3D-Rekonstruktion aus spärlichen Eingaben verbessert. Durch die Erweiterung des bestehenden Sichtfelds anstelle der Generierung neuer Kamerapositionen geht GaMO die Einschränkungen an, mit denen aktuelle Methoden konfrontiert sind.

GaMO verwendet eine Multi-View-Outpainting-Strategie, die bestehende Kamerapositionen nutzt, um die Detailgenauigkeit der Szene zu verbessern und gleichzeitig die geometrische Konsistenz aufrechtzuerhalten. Das Framework nutzt Multi-View-Bedingungen und geometrie-bewusste Rauschunterdrückungsmethoden in einem Zero-Shot-Ansatz, wodurch eine vorherige Schulung überflüssig wird.

Umfassende Bewertungen auf Datensätzen wie Replica und ScanNet++ zeigen, dass GaMO eine überlegene Rekonstruktionsqualität mit 3, 6 und 9 Eingabebildern erreicht und bestehende Modelle in den Metriken Peak Signal-to-Noise Ratio (PSNR) und Learned Perceptual Image Patch Similarity (LPIPS) übertrifft. Zudem bietet es eine $25\times$ Verbesserung der Verarbeitungsgeschwindigkeit gegenüber modernen, auf Diffusion basierenden Methoden, mit Gesamtverarbeitungszeiten von unter 10 Minuten.

Für weitere Details besuchen Sie die GaMO-Projektseite.

Verwandte Themen:

GaMOMulti-View Diffusion-OutpaintingSparse-View 3D-Rekonstruktiongeometrische KonsistenzRekonstruktionsqualität

📰 Originalquelle: https://arxiv.org/abs/2512.25073v1

Alle Rechte und Urheberrechte liegen beim ursprünglichen Herausgeber.

Artikel teilen