PulseAugur
实时 20:49:56
实体 Spider 2.0

Spider 2.0

PulseAugur coverage of Spider 2.0 — every cluster mentioning Spider 2.0 across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_68189 ·

    新的EntSQL基准测试企业知识中的文本到SQL

    研究人员推出了EntSQL,一个旨在评估企业环境中文本到SQL能力的新基准测试。与之前的基准测试不同,EntSQL专注于在长上下文、专有业务文档中进行SQL生成。该基准测试包含跨越五个业务领域的1,066个对齐的中英文示例,其中许多示例需要超出即时问题和模式的知识。当前系统在此任务上面临挑战,表现最好的模型在提供长篇文档时,在英文输入上的准确率仅为15.9%。