研究人员推出了一种新颖的文本到3D场景生成框架GuidedSceneGen,旨在克服以往方法中常见的尺度模糊和几何漂移问题。该系统在整个生成过程中保持绝对世界坐标系,首先通过文本描述预测全局3D布局。然后,一个扩散模型合成与该布局对齐的360°图像,视频扩散模型则有助于高效探索未观察到的区域。使用3D高斯溅射融合生成的视图,以精确的尺度创建可导航的3D场景,结果表明空间连贯性和布局合理性得到了改善。 AI
影响 该框架可以实现从文本生成更准确、更具可解释性的3D场景,对虚拟现实和建筑设计等领域产生影响。
排序理由 该集群包含一篇详细介绍3D场景生成新方法的论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →