PulseAugur
实时 08:04:20
实体 Search-E1

Search-E1

PulseAugur coverage of Search-E1 — every cluster mentioning Search-E1 across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
时间线
  1. 2026-05-21 research_milestone A new method called Search-E1 was introduced, demonstrating improved performance on QA benchmarks through self-distillation and self-evolution. 来源
  2. 2026-05-21 research_milestone A new self-evolution method for search-augmented reasoning agents, Search-E1, was detailed in a research paper. 来源
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_43947 ·

    Search-E1 方法通过自我进化简化了代理训练

    研究人员推出了一种新颖的搜索增强推理代理的自我进化方法 Search-E1,该方法绕过了复杂的外部监督。该方法结合了 vanilla GRPO 和离线自蒸馏 (OFSD),使代理能够独立改进。使用 Qwen2.5-3B 模型,该方法在七个 QA 基准测试中取得了 $0.440$ 的平均 EM 分数,优于现有的开源基线。