一篇新的研究论文探讨了大型语言模型(LLMs)如何做出主观选择,类似于在旅行辅助场景中推断支付意愿(WTP)。研究人员使用多项逻辑模型,从LLM对选择困境的响应中推导出WTP估计值,并将其与人类基准进行比较。研究发现,虽然更大的LLM可以产生有意义的WTP值,但它们表现出属性层面的偏差,并且倾向于高估人类的WTP,尤其是在面对昂贵的选项或面向商务的个性时。将模型设定为优先考虑更便宜选项的先验偏好,可以使其估值更接近人类基准,这凸显了在部署LLM用于决策支持角色时,提示设计和用户代表性的重要性。 AI
排序理由 该集群包含一篇详细介绍LLM行为研究发现的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
- Connected Papers
- Hugging Face
- large-language models
- Litmaps
- Manon Reusens
- multinomial logit models
- scite Smart Citations
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →