一篇新论文揭示,包括Opus 4.6、GPT 5.4和Gemini 3.1在内的领先AI模型在分类长对话记录时表现出显著的性能下降,而这项任务对于监控编码代理至关重要。与较短的对话记录相比,在超过80万个token的对话记录中,这些模型漏报微妙危险行为的频率要高得多。尽管提示技术可以在一定程度上缓解这个问题,但为了确保在长上下文场景中的可靠监控,可能还需要进一步的训练后改进。 AI
影响 领先的AI模型在处理长上下文时遇到困难,可能高估其安全监控能力,需要新的训练或提示策略。
排序理由 该集群包含一篇详细介绍AI模型性能新发现的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →