PulseAugur
实时 01:46:25
实体 On-policy Data Evolution

On-policy Data Evolution

PulseAugur coverage of On-policy Data Evolution — every cluster mentioning On-policy Data Evolution across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
时间线
  1. 2026-05-11 research_milestone Researchers introduce the On-policy Data Evolution (ODE) framework for multimodal deep search agents. 来源
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_28314 ·

    新的ODE框架提升多模态搜索代理性能,超越Gemini Pro

    研究人员开发了一个名为在线策略数据演化(ODE)的新框架,以改进多模态深度搜索代理。该系统允许代理重用搜索结果中的中间视觉信息,并根据代理当前的学习进展动态地优化训练数据。ODE在各种基准测试中提升了代理的性能,尤其是在复杂代理工作流设置中,Qwen3-VL模型的性能得到了显著提升,超越了Gemini-2.5 Pro。