对 Google 的 Gemma 4 E2B 模型进行的最新分析揭示了其在 2048 个 token 的上下文窗口下的意外行为。当输入被截断时,模型会生成一个三部分组成的回复:一个初步摘要,一个声明该摘要不在转录中的自我免责声明,然后是一个更谨慎的重试。在 32768 个 token 等较大的上下文窗口大小下未观察到这种行为,在这些情况下,模型能够正确识别输入问题而无需规避。这一发现纠正了先前关于该模型校准能力的论断。 AI
影响 揭示了特定模型中的细微行为,强调了上下文窗口大小在 LLM 输出中的重要性。
排序理由 基于实验结果对特定模型行为和能力进行的分析。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →