AI
Новости ИИ

GaMO: Многовидовая диффузионная аутпейнтинг-технология с учетом геометрии для 3D-реконструкции из разреженных видов

Source:arXiv
Оригинальный автор:Yi-Chuan Huang et al.
GaMO: Многовидовая диффузионная аутпейнтинг-технология с учетом геометрии для 3D-реконструкции из разреженных видов

Изображение создано Gemini AI

Недавние достижения в трехмерной реконструкции с использованием GaMO (Geometry-aware Multi-view Outpainter) решают проблемы существующих методов, которые сталкиваются с ограниченным числом входных изображений. Расширяя поле зрения от текущих поз камер, GaMO обеспечивает геометрическую согласованность и улучшает охват сцены. В тестах на Replica и ScanNet++ он продемонстрировал высокое качество реконструкции и скорость, в 25 раз превышающую показатели ведущих диффузионных методов, обрабатывая данные менее чем за 10 минут. Для получения дополнительной информации посетите страницу проекта: https://yichuanh.github.io/GaMO/.

GaMO Революционизирует 3D Реконструкцию с Помощью Геометрически Осознанного Многоугольного Диффузионного Выхода

Исследователи представили GaMO (Геометрически Осознанный Многоугольный Выход), структуру, которая улучшает 3D реконструкцию из разреженных входных данных. Вместо создания новых точек обзора камер, GaMO расширяет существующее поле зрения, что позволяет преодолеть ограничения, с которыми сталкиваются современные методы.

GaMO использует стратегию многоугольного выхода, которая опирается на существующие позы камер для улучшения детализации сцены, сохраняя при этом геометрическую согласованность. Структура применяет многоугольное кондиционирование и методы геометрически осознанного устранения шума в нулевом подходе, что исключает необходимость предварительного обучения.

Обширные оценки на таких наборах данных, как Replica и ScanNet++, показывают, что GaMO достигает превосходного качества реконструкции с 3, 6 и 9 входными видами, превосходя существующие модели по метрикам Пикового Отношения Сигнала к Шуму (PSNR) и Обученной Перцептивной Схожести Патчей Изображений (LPIPS). Он также демонстрирует улучшение скорости обработки в $25\times$ по сравнению с современными методами на основе диффузии, с общим временем обработки менее 10 минут.

Для получения дополнительной информации посетите Страницу Проекта GaMO.

Связанные темы:

GaMOмноговидовая диффузия3D-реконструкциягеометрические ограниченияPSNR и LPIPS

📰 Первоисточник: https://arxiv.org/abs/2512.25073v1

Все права и авторство принадлежат первоначальному издателю.

Поделиться статьей