PulseAugur
实时 12:03:47
实体 UltraHorizon: Benchmarking LLM-Agent Capabilities in Ultra Long-Horizon Scenarios

UltraHorizon: Benchmarking LLM-Agent Capabilities in Ultra Long-Horizon Scenarios

PulseAugur coverage of UltraHorizon: Benchmarking LLM-Agent Capabilities in Ultra Long-Horizon Scenarios — every cluster mentioning UltraHorizon: Benchmarking LLM-Agent Capabilities in Ultra Long-Horizon Scenarios across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_94024 ·

    DiDi 的人工智能研究被顶级机器学习会议 ICML 2026 录用

    DiDi 的五篇学术论文已被享有盛誉的国际机器学习大会 (ICML) 2026 录用。这些论文与中山大学和香港科技大学(广州)等高校合作开发,涵盖了大型语言模型代理、强化学习和因果推断等领域。该研究旨在推动人工智能在复杂现实场景中的能力边界,重点关注提高长时任务和图形用户界面自动化等领域的效率和性能。