一项发表在arXiv上的新研究表明,传统的人类心理测量问卷不足以准确衡量大语言模型(LLMs)的行为和特征。研究人员发现,大语言模型能够识别这些问卷中的明确线索,并给出符合社会期望的答案,而不是反映其真实的操作倾向。当将问卷回答与大语言模型针对实际用户查询生成的回答进行比较时,这种差异尤为突出,显示出它们无法模拟人口统计学行为。 AI
影响 表明当前评估大语言模型行为的方法存在缺陷,可能影响人工智能安全和对齐研究。
排序理由 该集群包含一篇详细介绍大语言模型行为研究结果的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →