爱沙尼亚语言研究所发布了一项名为“宣传抵抗”的新基准测试,以评估大型语言模型在抵御俄罗斯国家支持的虚假信息方面的能力。该基准测试涵盖了三种语言中的14种俄罗斯宣传叙事,模型回答了75个问题。Anthropic的Claude Opus 4.7表现最佳,得分接近满分,而NVIDIA的Nemotron 3 Super 120B和阿里巴巴的Qwen 3.6 Plus也表现出强大的抵抗力。 AI
影响 该基准测试强调了大型语言模型抵御虚假信息的重要需求,影响了未来模型开发和安全评估。
排序理由 政府相关机构发布基准测试。[lever_c_demoted from research: ic=1 ai=1.0]
在 Mastodon — fosstodon.org 阅读 →
- Alibaba
- Anthropic
- Claude Opus 4.7
- Estonia
- Gemini 2.5 Pro
- Gemini 3.5 Flash
- GPT-3.5 Turbo
- GPT-5.4
- Nemotron 3 Super 120B
- NVIDIA
- OpenAI
- Qwen 3.6 Plus
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →