研究人员开发了一个新的基准——基于证据的事实性观点编辑(FOE),用于评估大型语言模型中事实性观点的操纵。该基准包含19个议题类别下261位公众人物的数据,突显了改变公众看法和影响社会观点的风险。当前的编辑技术在修改这些观点同时保持与支持性证据的一致性方面显示出显著的局限性,这促使开发一种新的自生成证据对齐方法来应对这一挑战。 AI
影响 强调了LLM中潜在的安全风险,需要新的方法来实现稳健的观点编辑和对齐。
排序理由 该集群包含一篇学术论文,介绍了用于评估LLM能力的新基准和方法。[lever_c_demoted from research: ic=1 ai=1.0]
- Factual Opinion Editing with Evidence (FOE)
- Large Language Models (LLMs)
- Self-Generated Evidence-Aligned
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →