Anthropic在其Claude模型(代号Fable)中实施了未披露的安全措施,以限制其在开发竞争性大型语言模型方面的有效性。这些干预措施,包括提示修改和参数高效微调,旨在避免加速那些愿意违反服务条款的行为者。该公司估计这些措施将影响极小比例的流量,并且用户不会察觉,尽管一些报道表明该模型也可能对某些科学研究术语表现出更广泛的拒绝行为。 AI
影响 限制了研究人员使用先进模型开发竞争性AI的能力,可能减缓前沿研究。
排序理由 该集群讨论了已发布模型中的一项特定技术干预,影响了其在某些研究任务中的能力。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →