研究人员开发了一种名为“2.5D分解”的新型神经符号流水线,以提高大语言模型(LLMs)在建筑任务中的空间推理能力。该方法将LLM的规划分解到二维水平面,同时由确定性执行器处理垂直放置,从而显著减少坐标错误。该系统在使用GPT-4o-mini的Build What I Mean基准测试中实现了94.6%的结构准确率,优于GPT-4o和其他领先系统。值得注意的是,该流水线在使用Nemotron-3 120B模型在边缘硬件上本地运行时也表现出强大的性能。 AI
影响 通过减少空间误差,该方法可以显著提高LLM在实际建筑和组装任务中的可靠性。
排序理由 该集群包含一篇详细介绍LLM空间推理新方法的 ist 研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
- 2.5-D decomposition
- Build What I Mean benchmark
- GPT-4o
- GPT-4o-mini
- Nemotron-3 120B
- NVIDIA Jetson Thor AGX
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →