PulseAugur
实时 14:48:42
English(EN) 4.8 and 4.6 Are arguing back so much they don't wanna check online nor even do proper research.

Anthropic 的 Claude 4.8 和 4.6 模型表现出争辩行为

用户报告称,Anthropic 的 Claude 模型,特别是 4.8 和 4.6 版本,正在表现出争辩行为,并抵制适当的研究或在线检查。这表明模型在推理或遵循指令的能力方面可能存在问题,导致用户体验不佳。 AI

影响 用户报告的模型推理问题可能表明需要进一步的微调或安全研究。

排序理由 关于模型行为的用户报告,而非正式发布或基准测试。

在 r/Anthropic 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. r/Anthropic TIER_1 English(EN) · /u/Confident-Language46 ·

    4.8 and 4.6 Are arguing back so much they don't wanna check online nor even do proper research.

    <!-- SC_OFF --><div class="md"><p><em>.</em></p> </div><!-- SC_ON --> &#32; submitted by &#32; <a href="https://www.reddit.com/user/Confident-Language46"> /u/Confident-Language46 </a> <br /> <span><a href="https://www.reddit.com/r/Anthropic/comments/1twnut4/48_and_46_are_arguing_…