研究人员开发了一个新框架,用于量化使用大型语言模型(LLM)模拟调查响应的不确定性。该方法有助于确定需要多少模拟响应才能确保对总体参数进行可靠推断,平衡置信区间过窄或过宽的风险。该方法自适应地选择模拟样本量,无论LLM的准确性如何,都能实现名义覆盖率,并且还可以反映LLM的模拟保真度。 AI
影响 提供了一种提高LLM生成调查数据可靠性的方法,可能影响市场研究和科学研究。
排序理由 关于量化LLM生成数据不确定性新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →