PulseAugur
实时 11:49:40
English(EN) 2.5-D Decomposition for LLM-Based Spatial Construction

2.5D分解流水线提升大语言模型在建筑任务中的空间推理能力

研究人员开发了一种名为“2.5D分解”的新型神经符号流水线,以提高大语言模型(LLMs)在建筑任务中的空间推理能力。该方法将LLM的规划分解到二维水平面,同时由确定性执行器处理垂直放置,从而显著减少坐标错误。该系统在使用GPT-4o-mini的Build What I Mean基准测试中实现了94.6%的结构准确率,优于GPT-4o和其他领先系统。值得注意的是,该流水线在使用Nemotron-3 120B模型在边缘硬件上本地运行时也表现出强大的性能。 AI

影响 通过减少空间误差,该方法可以显著提高LLM在实际建筑和组装任务中的可靠性。

排序理由 该集群包含一篇详细介绍LLM空间推理新方法的 ist 研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

2.5D分解流水线提升大语言模型在建筑任务中的空间推理能力

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Paul Whitten, Li-Jen Chen, Sharath Baddam ·

    2.5-D Decomposition for LLM-Based Spatial Construction

    arXiv:2605.07066v3 Announce Type: replace Abstract: Autonomous systems that build structures from natural-language instructions need reliable spatial reasoning, yet large language models (LLMs) make systematic coordinate errors when generating three-dimensional block placements. …