研究人员调查了使用由大型语言模型驱动的数字身份替代调查中的人类受访者的可靠性。他们的研究利用 LISS 面板以及各种身份架构和大型语言模型,发现这些身份能够有效近似人类的响应分布,尤其是在与稳定属性和价值观相关的问题上。然而,身份在个体预测方面显示出局限性,并且未能捕捉到复杂的受访者结构。数字身份的有效性被发现更多地取决于人类响应的内在结构,而不是所使用的特定大型语言模型,在变化较少和常见的模式上表现最佳,在主观或罕见的响应上表现最差。 AI
影响 为在调查研究中恰当使用大型语言模型生成的身份提供了指导,并强调了人类验证仍然至关重要的领域。
排序理由 学术论文,详细介绍了关于大型语言模型驱动的数字身份在调查研究中的能力和局限性的研究。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →