PulseAugur
实时 11:27:42
实体 MLGym

MLGym

PulseAugur coverage of MLGym — every cluster mentioning MLGym across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_104768 ·

    新的ARTS AI方法通过推理模型加速科学发现

    研究人员推出了一种名为Agentic Reasoning for Tree Search (ARTS) 的新颖科学发现方法,该方法利用推理语言模型来导航假设和实验空间。与混淆假设优劣与实验执行质量的传统方法不同,ARTS诊断失败,以区分错误的实现和有缺陷的假设。该系统表现出显著的改进,在MLGym和MLEBench的22项任务上,其性能比领先算法高出15.3%以上。此外,ARTS表明,具有测试时训练的Qwen3-4B模型可以以显著更低…