PulseAugur
实时 08:28:15
English(EN) xAI Grok 4.1: #1 in Text Arena, #1 in EQ-bench, and better Creative Writing

xAI 的 Grok 4.1 在文本竞技场和 EQ-bench 中领先,创意写作表现出色

xAI 发布了 Grok 4.1,该模型在 Chatbot ArenaEQ-bench 评估中均取得了最高排名。该公司报告称,新版本在创意写作能力方面比前代产品有所提升。这些进步使 Grok 4.1 在多项关键性能指标上处于领先地位。 AI

排序理由 前沿模型发布,附带系统卡。

在 Smol AINews 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. Smol AINews TIER_1 English(EN) ·

    xAI Grok 4.1: #1 in Text Arena, #1 in EQ-bench, and better Creative Writing

    **xAI** launched **Grok 4.1**, achieving a #1 rank on the LM Arena Text Leaderboard with an Elo score of **1483**, showing improvements in creative writing and anti-hallucination. **OpenAI's GPT-5.1 "Thinking"** demonstrates efficiency gains with ~60% less "thinking" on easy quer…