PulseAugur
实时 05:00:47
实体 SQA-CS-V2

SQA-CS-V2

PulseAugur coverage of SQA-CS-V2 — every cluster mentioning SQA-CS-V2 across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_48700 ·

    新的Co-ReAct框架使用分步评分标准指导AI代理

    研究人员开发了Co-ReAct,一个使用分步评分标准指导ReAct风格AI代理在推理过程中进行决策的新框架。该方法旨在改善搜索密集型、多步推理任务的决策过程,这类任务通常会产生浅层或冗余的轨迹。Co-ReAct在每个步骤将评分标准注入代理的上下文中,以指导证据搜寻、推理和自我评估,从而在DeepResearchBench和SQA-CS-V2等基准测试中取得持续改进。