English(EN) EntSQL: A Benchmark for Grounding Text-to-SQL in Long-Context Enterprise Knowledge

新的EntSQL基准测试企业知识中的文本到SQL

作者 PulseAugur 编辑部 · [2 个来源] · 2026-06-02 09:12

研究人员推出了EntSQL，一个旨在评估企业环境中文本到SQL能力的新基准测试。与之前的基准测试不同，EntSQL专注于在长上下文、专有业务文档中进行SQL生成。该基准测试包含跨越五个业务领域的1,066个对齐的中英文示例，其中许多示例需要超出即时问题和模式的知识。当前系统在此任务上面临挑战，表现最好的模型在提供长篇文档时，在英文输入上的准确率仅为15.9%。 AI

影响凸显了将LLM应用于企业特定数据的挑战，可能推动更具上下文感知能力的文本到SQL系统的发展。

排序理由该集群描述了一个用于评估AI能力的新学术基准测试。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

arXiv cs.CL TIER_1 English(EN) · Chengxi Liao, Tao Xu, Zulong Chen, Chuanfei Xu, Yiyan Wang, Xinyun Wang, Yanlong Zhang, Xiaojun Chen, Zhibo Yang, Zeyi Wen · 2026-06-03 04:00

EntSQL：长上下文企业知识中文本到SQL的基准测试

arXiv:2606.03363v1 Announce Type: new Abstract: Text-to-SQL enables natural language access to databases, and recent LLMs have substantially advanced its capabilities. Existing benchmarks such as Spider, BIRD, and Spider~2.0 evaluate schema generalization, large-scale databases, …
arXiv cs.CL TIER_1 English(EN) · Zeyi Wen · 2026-06-02 09:12

EntSQL：长上下文企业知识中文本到SQL的基准测试

Text-to-SQL enables natural language access to databases, and recent LLMs have substantially advanced its capabilities. Existing benchmarks such as Spider, BIRD, and Spider~2.0 evaluate schema generalization, large-scale databases, and realistic workflows, but largely overlook en…

报道来源 [2]

EntSQL：长上下文企业知识中文本到SQL的基准测试

EntSQL：长上下文企业知识中文本到SQL的基准测试

相关实体

相关话题