GaMO:基于几何感知的多视角扩散外推技术用于稀疏视图三维重建

Gemini AI生成的图像
最近,使用GaMO(几何感知多视角外推器)的3D重建技术取得了重要进展,成功克服了现有方法在输入视角有限时的局限性。GaMO通过扩展当前相机位置的视野,保持几何一致性并增强场景覆盖率。在对Replica和ScanNet++的测试中,其重建质量显著优于领先的扩散方法,并实现了高达25倍的加速,处理时间在10分钟以内。欲了解更多详情,请访问项目页面:https://yichuanh.github.io/GaMO/。
GaMO通过几何感知多视角扩展革新3D重建
研究人员揭示了GaMO(几何感知多视角扩展器),这是一个增强稀疏视图输入的3D重建框架。GaMO通过扩展现有的视场而不是生成新的相机视点,解决了当前方法面临的局限性。
GaMO采用了一种多视角扩展策略,利用现有相机位姿来增强场景细节,同时保持几何一致性。该框架在零-shot方法中利用多视角条件和几何感知去噪方法,消除了对先前训练的需求。
在Replica和ScanNet++等数据集上的广泛评估显示,GaMO在3、6和9个输入视图下实现了卓越的重建质量,在峰值信噪比(PSNR)和学习感知图像块相似度(LPIPS)指标上超越了现有模型。它在处理速度上也比最先进的基于扩散的方法提高了$25\times$,总处理时间不到10分钟。
欲了解更多详情,请访问GaMO项目页面。
相关主题:
GaMO几何感知多视角扩展稀疏视角3D重建
📰 原始来源: https://arxiv.org/abs/2512.25073v1
所有权利和署名均属于原出版商。