一款名为Llama 4 Scout的新AI模型发布,声称拥有1000万token的上下文窗口,远超OpenAI、Anthropic和Google等现有模型。该模型采用混合专家(Mixture-of-Experts)架构和交错旋转位置嵌入(iRoPE)技术来管理其超长上下文,并且定价实惠。然而,实际测试显示其存在局限性,在托管平台上实际上下文窗口被限制在327,680 token,并且在约256,000 token之后理解能力显著下降,使其在声称的全部容量下更像一个搜索引擎索引而非推理伙伴。 AI
影响 挑战了现有的长上下文模型和定价策略,但实际局限性可能会削弱其影响。
排序理由 新模型发布,声称能力大幅提升。[lever_c_demoted from frontier_release: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →