PulseAugur
实时 20:24:57
中文(ZH) Claude 4.8炸场!部分能力超过Mythos,支持数百子智能体并行

Anthropic 的 Claude Opus 4.8 增强了推理、诚实度和并行代理工作流

Anthropic 发布了 Claude Opus 4.8,这是一个重大的更新,提高了其推理和编码能力,部分基准测试显示其超越了Mythos。一项关键的进步是其增强的诚实度,减少了过度自信的实例,并报告了更少的代码缺陷。此次发布还引入了“动态工作流”(Dynamic Workflows),这是一项新功能,允许数百个子代理并行处理复杂任务,并通过一项大规模代码移植项目进行了演示。 AI

影响 为代理工作流和模型诚实度设定了新标杆,可能加速复杂任务的自动化。

排序理由 来自前沿人工智能实验室(Anthropic)的新模型发布,附有详细的系统卡和功能公告。[lever_c_demoted from frontier_release: ic=1 ai=1.0]

在 量子位 (QbitAI) 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. 量子位 (QbitAI) TIER_1 中文(ZH) · 梦晨 ·

    Claude 4.8 震撼登场!部分能力超越Mythos,支持数百个子智能并行

    可以长时间执行任务,人类不用经常回来检查它的工作