PulseAugur
实时 22:13:14
English(EN) These LLMs are the best at resisting Russian propaganda

Anthropic的Claude模型在新的俄罗斯宣传抵御基准测试中领先

爱沙尼亚语言研究所与Propastop合作,开发了一个新的基准测试,以评估大型语言模型抵御俄罗斯宣传的能力。测试包括用英语、爱沙尼亚语和俄语提出问题,旨在诱导错误信息或宣传叙事。在专有前沿模型中,Anthropic的Claude模型,特别是Opus 4.7,表现出最强的性能,在77%的测试问题上取得了模范分数。 AI

影响 该基准测试突显了大型语言模型可能受到国家支持的宣传影响,强调了采取强有力安全措施和进一步研究模型对齐的必要性。

排序理由 该集群描述了一个新的基准测试和对大型语言模型的评估,属于研究范畴。[lever_c_demoted from research: ic=1 ai=1.0]

在 Ars Technica — AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

Anthropic的Claude模型在新的俄罗斯宣传抵御基准测试中领先

报道来源 [1]

  1. Ars Technica — AI TIER_1 English(EN) · Kyle Orland ·

    These LLMs are the best at resisting Russian propaganda

    Estonian government benchmark shows how dozens of models combat Russia's "strategic narratives."