PulseAugur
实时 21:19:33
实体 ASTRA-QA

ASTRA-QA

PulseAugur coverage of ASTRA-QA — every cluster mentioning ASTRA-QA across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_27554 ·

    新的ASTRA-QA基准评估抽象问答能力

    研究人员推出了ASTRA-QA,一个旨在评估文档抽象问答能力的新基准。该基准通过提供明确的评估注释,包括答案主题集和精选的不支持主题,来解决现有方法的局限性,从而实现更稳健的评分。ASTRA-QA旨在评估模型综合信息和避免生成不支持内容的能力,并提供覆盖率和幻觉的诊断。