[Paper] 自演化 3D 场景生成(单张图像)

发布: (2025年12月10日 GMT+8 02:44)
7 min read
原文: arXiv

Source: arXiv - 2512.08905v1

概览

EvoScene 解决了将 单张 2‑D 照片转换为完整、带纹理的 3‑D 场景 的长期难题。通过巧妙地将现有的 3‑D 几何生成器与视频式 2‑D 扩散模型拼接在一起,框架在无需额外训练数据的情况下,迭代地细化形状和外观。最终得到的可直接使用的 3‑D 网格既保持结构忠实度,又具备视角一致的纹理——这在大多数以对象为中心的流水线中一直难以实现。

关键贡献

  • 自我进化流水线:在 2‑D 与 3‑D 域之间交替进行,逐步从单张图像提升场景质量。
  • 互补模型的混合使用:3‑D 生成器提供粗糙几何,视频扩散模型注入丰富视觉细节并填补未见区域。
  • 三阶段迭代过程(空间先验初始化 → 视觉引导网格生成 → 空间引导新视角生成),收敛到稳定的高质量网格。
  • 无需训练:系统即插即用,使用预训练模型,无需昂贵的场景专属数据采集。
  • 在多种室内外场景上优于强基线,在几何稳定性、纹理一致性和完整性方面均有可量化提升。

方法论

  1. 空间先验初始化 – 将输入照片送入预训练的 3‑D 生成模型(如 NeRF‑style 或基于体素的网络),得到初始的粗糙网格和深度图。该步骤提供墙面、地面和大物体的粗略布局。
  2. 视觉引导的 3‑D 场景网格生成 – 将粗糙网格从多个视角渲染后输入视频扩散模型(在连续帧上训练的 2‑D 生成模型)。扩散模型细化每个视角的纹理,补充缺失细节,并为遮挡区域预测合理内容。随后将精炼后的图像重新投影回网格,更新顶点颜色和纹理。
  3. 空间引导的新视角生成 – 使用已丰富的网格作为空间先验,视频扩散模型合成原始照片中未出现的全新视角。这些新视角再反馈给 3‑D 生成器,以进一步纠正几何(例如修复细长结构或深度误差)。
  4. 迭代循环 – 步骤 2 与 3 重复若干次,直至变化低于阈值,得到一个稳定的高分辨率网格,且在所有角度上纹理保持一致。

整个流水线 模块化:任何现成的 3‑D 生成器和任何视频扩散模型都可以替换,使系统能够适配未来模型的升级。

结果与发现

  • 几何稳定性:相较于单图像 NeRF 与以对象为中心的扩散流水线,EvoScene 在基准室内场景上将平均深度误差降低约 30%。
  • 纹理一致性:在 360° 旋转下,学习得到的纹理保持颜色和图案连续性,感知相似度分数比竞争方法低 25%(即相似度更高)。
  • 未见区域补全:视频扩散组件成功为遮挡区域(如房间后墙)“幻化”出合理的几何和纹理,在与真实 3‑D 扫描的结构相似度指数(SSIM)上取得更高分。
  • 运行时间:完整重建(包括 3 次迭代循环)在单块 RTX 4090 上约需 8‑12 分钟,已足够多数内容创作流水线使用。
  • 输出:最终产物为标准的 OBJ/GLTF 网格,带 UV 映射纹理,可直接导入游戏引擎、AR/VR 平台或 CAD 工具。

实际意义

  • 游戏与 VR 的快速原型:设计师可仅凭一张参考照片生成整间房间或户外布局,大幅缩短资产制作时间。
  • 电商与室内设计:单张产品或房间照片即可转化为交互式 3‑D 模型,用于虚拟试穿或布局规划。
  • 机器人与仿真:自主系统可从单张相机快照快速构建环境地图,提高仿真真实度,无需大量扫描。
  • 内容创作工具:可集成到 Blender、Unity、Unreal 等 3‑D 建模软件中,作为 “单图像导入” 功能,让艺术家专注于高层次设计而非低层次建模。
  • 低成本数字化:没有多视角捕捉设备的小型工作室或业余爱好者也能产出高质量 3‑D 资产,推动 3‑D 内容生产的民主化。

局限性与未来工作

  • 依赖预训练模型质量:流水线会继承底层 3‑D 生成器和视频扩散模型的偏差与失效模式(例如对高度反光或透明表面的处理困难)。
  • 场景规模:极大户外环境仍面临内存和分辨率瓶颈,当前实现最适用于深度在几米范围内的场景。
  • 迭代收敛:虽然大多数情况三次迭代已足够,但某些复杂拓扑可能需要更多循环,导致计算时间增加。
  • 未来方向:作者建议引入深度感知的扩散模型,探索层次化场景分解(房间层 → 物体层),以及将框架扩展至动态场景或多模态输入(如深度传感器)。

作者

  • 郑凯志
  • 范跃
  • 顾静
  • 徐子硕
  • 何学海
  • 王新 Eric

论文信息

  • arXiv ID: 2512.08905v1
  • 分类: cs.CV
  • 发表时间: 2025年12月9日
  • PDF: Download PDF
Back to Blog

相关文章

阅读更多 »