PulseAugur
实时 13:08:16
实体 EnterpriseDocBench

EnterpriseDocBench

PulseAugur coverage of EnterpriseDocBench — every cluster mentioning EnterpriseDocBench across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_09820 ·

    新框架对企业人工智能文档处理流水线进行基准测试

    研究人员开发了EnterpriseDocBench,这是一个用于评估企业人工智能文档处理流水线端到端性能的新框架。该框架跨越六个企业领域评估解析保真度、索引效率、检索相关性和生成基础性。初步测试显示,混合检索方法略优于BM25,并且令人惊讶的是,与中等长度的文档相比,非常短和非常长的文档中的幻觉率更高。一个关键的发现是,虽然事实准确性很高,但答案的完整性却显著较低,这表明人工智能系统经常遗漏关键信息。