PulseAugur
实时 11:02:15
实体 DEEPRUBRIC

DEEPRUBRIC

PulseAugur coverage of DEEPRUBRIC — every cluster mentioning DEEPRUBRIC across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_93572 ·

    DeepRubric 框架提升 AI 研究代理效率

    研究人员推出了一种新颖的框架 DeepRubric,用于构建查询-评分标准对,以提高深度研究代理强化学习的效率。该方法首先识别评估目标,然后构建证据树以确保评分标准准确反映给定查询的信息需求,从而合成对齐的查询-评分标准对。通过使用这种方法训练 DeepRubric-8B 模型,研究人员在计算资源显著减少的情况下取得了与现有最先进模型相当的性能。