AI
Notícias IA

GaMO: Outpainting de Difusão Multi-visual Consciente de Geometria para Reconstrução 3D com Visões Esparsas

Source:arXiv
Autor original:Yi-Chuan Huang et al.
GaMO: Outpainting de Difusão Multi-visual Consciente de Geometria para Reconstrução 3D com Visões Esparsas

Imagem gerada por Gemini AI

Avanços recentes na reconstrução 3D utilizando o GaMO (Geometry-aware Multi-view Outpainter) enfrentam as limitações dos métodos existentes que têm dificuldades com um número reduzido de vistas de entrada. Ao expandir o campo de visão a partir das poses atuais das câmeras, o GaMO mantém a consistência geométrica e melhora a cobertura da cena. Em testes realizados no Replica e no ScanNet++, o GaMO alcançou uma qualidade de reconstrução superior e um aumento de $25\times$ na velocidade em comparação com os principais métodos de difusão, processando em menos de 10 minutos. Para mais detalhes, visite a página do projeto: https://yichuanh.github.io/GaMO/.

GaMO Revoluciona a Reconstrução 3D com Outpainting de Difusão Multi-visualização Sensível à Geometria

Pesquisadores revelaram o GaMO (Outpainter Multi-visualização Sensível à Geometria), uma estrutura que melhora a reconstrução 3D a partir de entradas de visualização esparsas. Ao expandir o campo de visão existente em vez de gerar novos pontos de vista de câmera, o GaMO aborda as limitações enfrentadas pelos métodos atuais.

O GaMO utiliza uma estratégia de outpainting multi-visualização que aproveita as poses de câmera existentes para aprimorar os detalhes da cena enquanto mantém a consistência geométrica. A estrutura emprega métodos de condicionamento multi-visualização e denoising sensível à geometria em uma abordagem zero-shot, eliminando a necessidade de treinamento prévio.

Avaliações extensivas em conjuntos de dados como Replica e ScanNet++ mostram que o GaMO alcança uma qualidade de reconstrução superior com 3, 6 e 9 visualizações de entrada, superando modelos existentes nas métricas de Razão de Pico de Sinal para Ruído (PSNR) e Similaridade de Patches de Imagem Perceptual Aprendida (LPIPS). Ele também apresenta uma melhoria de $25\times$ na velocidade de processamento em relação aos métodos de difusão de última geração, com tempos de processamento total abaixo de 10 minutos.

Para mais detalhes, visite a Página do Projeto GaMO.

Tópicos relacionados:

GaMOreconstrução 3Dvisões esporádicasoutpainting multi-visualizaçãoconsistência geométrica

📰 Fonte original: https://arxiv.org/abs/2512.25073v1

Todos os direitos e créditos pertencem ao editor original.

Compartilhar este artigo