遥测数据分析表明,OpenAI 的 GPT-5.5 Codex 模型在 516、1034 和 1552 等特定值下表现出异常的推理令牌聚类。这种现象与复杂任务的性能下降相关,表明模型推理预算中可能存在瓶颈或隐藏机制。研究人员假设这可能是一个系统级限制,而非令牌输出的自然分布,促使开发团队进行进一步调查。 AI
影响 GPT-5.5 Codex 中潜在的系统级限制可能会影响复杂任务的性能,并表明需要进行架构审查。
排序理由 对 GitHub 问题中模型行为和遥测数据的分析。
在 Mastodon — fosstodon.org 阅读 →
AI 生成摘要 · Google Gemini · 来自 4 个来源。 我们如何撰写摘要 →