研究人员推出ProvenAI,一个旨在增强检索增强问答系统透明度的框架。该框架在三个不同层面衡量透明度:答案正确性、引用保真度以及引用来源对生成输出的影响。在HotpotQA基准测试的实验中,ProvenAI实现了53.53%的答案准确率和71.55%的引用保真度得分,揭示了一个“引用影响差距”,即引用的来源并非总是显著影响答案。 AI
影响 该框架通过提供可衡量的答案生成和引用方式的透明度,有望带来更值得信赖的AI系统。
排序理由 该集群包含一篇详细介绍AI透明度新框架的研究论文。
在 arXiv cs.IR (Information Retrieval) 阅读 →
AI 生成摘要 · Google Gemini · 来自 3 个来源。 我们如何撰写摘要 →