AI
Notizie IA

GaMO: Diffusione Outpainting Multi-view Consapevole della Geometria per la Ricostruzione 3D da Visione Sparsa

Source:arXiv
Autore originale:Yi-Chuan Huang et al.
GaMO: Diffusione Outpainting Multi-view Consapevole della Geometria per la Ricostruzione 3D da Visione Sparsa

Immagine generata da Gemini AI

Recenti progressi nella ricostruzione 3D grazie a GaMO (Geometry-aware Multi-view Outpainter) affrontano le limitazioni dei metodi esistenti, che faticano con un numero ridotto di viste in ingresso. Espandendo il campo visivo dalle attuali posizioni della telecamera, GaMO mantiene la coerenza geometrica e migliora la copertura della scena. Nei test condotti su Replica e ScanNet++, ha raggiunto una qualità di ricostruzione superiore e un incremento della velocità di $25\times$ rispetto ai principali metodi di diffusione, completando il processo in meno di 10 minuti. Per ulteriori dettagli, visita la pagina del progetto: https://yichuanh.github.io/GaMO/.

GaMO Rivoluziona la Ricostruzione 3D con Outpainting Multi-view Consapevole della Geometria

I ricercatori hanno svelato GaMO (Outpainter Multi-view Consapevole della Geometria), un framework che migliora la ricostruzione 3D a partire da input con visuali sparse. Espandendo il campo visivo esistente piuttosto che generare nuovi punti di vista della telecamera, GaMO affronta le limitazioni delle attuali metodologie.

GaMO impiega una strategia di outpainting multi-view che sfrutta le posizioni delle telecamere esistenti per migliorare i dettagli della scena, mantenendo al contempo la coerenza geometrica. Il framework utilizza metodi di condizionamento multi-view e denoising consapevole della geometria in un approccio zero-shot, eliminando la necessità di un addestramento preventivo.

Valutazioni approfondite su dataset come Replica e ScanNet++ mostrano che GaMO raggiunge una qualità di ricostruzione superiore con 3, 6 e 9 visuali di input, superando i modelli esistenti in termini di Peak Signal-to-Noise Ratio (PSNR) e Learned Perceptual Image Patch Similarity (LPIPS). Vanta inoltre un miglioramento di $25\times$ nella velocità di elaborazione rispetto ai metodi all'avanguardia basati su diffusione, con tempi di elaborazione totali inferiori a 10 minuti.

Per ulteriori dettagli, visita la Pagina del Progetto GaMO.

Argomenti correlati:

GaMOricostruzione 3Doutpainting multi-viewcoerenza geometricastrategie di condizionamento

📰 Fonte originale: https://arxiv.org/abs/2512.25073v1

Tutti i diritti e i crediti appartengono all'editore originale.

Condividi questo articolo