PulseAugur
实时 16:10:10
实体 Test-Time Exploration

Test-Time Exploration

PulseAugur coverage of Test-Time Exploration — every cluster mentioning Test-Time Exploration across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
时间线
  1. 2026-05-26 research_milestone Researchers published a paper detailing the Test-Time Exploration framework and its effectiveness in helping AI agents infer implicit rules. 来源
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_50861 ·

    新AI框架帮助智能体推断隐藏规则

    研究人员开发了一个名为测试时探索(TTExplore)的新框架,以帮助AI智能体更好地驾驭具有隐含规则的环境。这些隐藏的约束条件常常导致智能体陷入重复的试错循环。TTExplore使用一个“思考者”组件,从交互历史中推断这些规则并指导一个“执行者”智能体。该系统采用了一种新颖的强化学习流程,使用任务级别的分数作为间接奖励,绕过了评估中间推理步骤的难度。实验表明,由名为Exp-Thinker的专用7B模型驱动的TTExplore,显著提…