PulseAugur
实时 11:32:30
实体 QA benchmarks

QA benchmarks

PulseAugur coverage of QA benchmarks — every cluster mentioning QA benchmarks across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_93552 ·

    PathRouter框架通过将奖励与检索质量对齐来改进代理图检索增强生成

    研究人员推出了一种新颖的训练框架PathRouter,旨在增强代理图检索增强生成(GraphRAG)系统。该框架解决了仅基于结果的强化学习中固有的奖励别名和搜索-更新歧义等问题。PathRouter根据答案正确性和证据路径重叠来评估轨迹,区分不同类别以抑制捷径同时鼓励证据搜寻。实验表明,PathRouter在各种模型规模下显著提高了答案F1分数和证据路径重叠度。