一篇新的研究论文探讨了政治新闻文章中的主题情感是否会影响感知意识形态,以及这种影响在人类和大型语言模型(LLM)之间是否存在差异。研究发现,虽然人类标注者没有表现出显著的因果关系,但经过微调的GPT-4o-mini模型却表现出情感和意识形态之间的虚假相关性。这表明LLM可能学会了人类判断中不明显且标准准确率指标(如F1分数)无法察觉的捷径。 AI
影响 突出了LLM生成标注中潜在的偏见,影响其在研究和下游应用中的使用。
排序理由 学术论文,详细介绍了LLM行为的新发现。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →