研究人员开发了新的基准和模型,以提高 AI 代理在真实本地生活服务场景中的性能。其中一个基准 LocalSearchBench 包含超过 130 万个商家条目和 900 个多跳问答任务,揭示了即使是最先进的模型在准确性和忠实度方面也存在困难。另一种方法 LocalSUG 使用城市偏好增强的大语言模型来改进本地生活平台上的查询建议,在实际测试中显示低结果率降低和点击率提高。 AI
影响 这些进展旨在提高 AI 代理在专业领域的性能,可能带来更有效的本地服务发现和用户交互。
排序理由 该集群包含两篇研究论文,介绍了用于本地生活服务中 AI 的新基准和模型。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →