PulseAugur
实时 19:19:42
English(EN) Claude’s new model is more ‘honest’ when it messes up

Anthropic 的 Claude Opus 4.8 增强了诚实度和任务管理能力

Anthropic 公司正在发布 Claude Opus 4.8,这是一个旨在更加诚实且不易做出无根据声明的新模型。据报道,该版本在忽略生成的代码缺陷方面比其前代产品可能性低四倍。此次更新还引入了一项功能,允许用户控制响应的努力程度,平衡质量和 token 使用量,以及一个用于通过并行子代理处理更大、更复杂任务的“动态工作流”预览。 AI

影响 通过减少无根据的声明和改进代码缺陷检测来增强 AI 的可靠性,从而可能增加对 AI 系统的信任。

排序理由 Frontier-lab 模型发布,附带系统卡。[lever_c_demoted from frontier_release: ic=2 ai=1.0]

在 The Verge — AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

Anthropic 的 Claude Opus 4.8 增强了诚实度和任务管理能力

报道来源 [2]

  1. The Verge — AI TIER_1 English(EN) · Jay Peters ·

    Claude’s new model is more ‘honest’ when it messes up

    Anthropic is releasing Claude Opus 4.8 on Thursday, and the company is touting the model's "honesty." According to Anthropic, it trains "all [its] models to be honest - for instance, to avoid making claims that they can't support." But it notes that "a general problem with AI mod…

  2. Mastodon — mastodon.social TIER_1 English(EN) · [email protected] ·

    Claude's new model is more 'honest' when it messes up https://www.theverge.com/ai-artificial-intelligence/939094/anthropic-claude-4-8-opus-honesty-effort # AI #

    Claude's new model is more 'honest' when it messes up https://www.theverge.com/ai-artificial-intelligence/939094/anthropic-claude-4-8-opus-honesty-effort # AI # Tech # OpenSource