研究人员发现了嵌入在Qwen 3.5大型语言模型权重中的政治审查证据。分析显示,该模型在回应中表现出偏见,淡化或省略与敏感政治话题相关的信息。这表明Qwen 3.5的训练数据或微调过程可能包含了控制或过滤某些政治叙事的刻意行为。 AI
影响 揭示了大型语言模型训练数据中存在政治偏见的可能性,影响信息获取和信任度。
排序理由 该集群描述了一篇分析大型语言模型内置审查的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
在 Mastodon — mastodon.social 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →