一位 Reddit 用户报告称,在 MineBench 框架内,当被提示生成“摩天大楼”时,GPT 4.5 输出了“HELP”一词。在尝试了大约 30 次后,模型一致生成了摩天大楼,这种异常输出仅在该特定实例中发生。用户发现这种行为很有趣,并指出模型精确地遵循了 MineBench 规则和工具模式,但用“HELP”替换了请求的输出。 AI
影响 突显了模型行为和涌现特性的潜在不可预测性,即使在特定的基准测试环境中也是如此。
排序理由 用户报告的模型行为异常,并非官方发布或基准测试。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →