Anthropic 发布了 Claude Fable 5,一个在软件工程和研究等领域被描述为能力极强的模型,并增强了安全功能。Google 也在推出 Gemini 3.5 Live Translate,这是一个用于实时语音到语音跨多种语言翻译的音频模型。该集群还触及了测试时间计算在评估 LLM 性能方面日益增长的重要性,表明传统的基准测试可能变得信息量减少。 AI
影响 Anthropic 和 Google 的新模型增强了多语言能力,并表明 LLM 评估正转向测试时间计算。
排序理由 集群包含 Anthropic 新模型 Claude Fable 5 的发布公告。[lever_c_demoted from frontier_release: ic=1 ai=1.0]
- Anthropic
- Claude Fable 5
- Claude Mythos 5
- Cohere
- DeepSeek-V4
- Gemini 3.5 Live Translate
- GPT-5.4
- GPT-5.5
- North Mini Code
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →