研究人员推出了VeriTaS,一个新颖的动态基准,旨在评估多模态内容的自动化事实核查系统。与可能因大型语言模型预训练而受损的静态基准不同,VeriTaS每季度更新一次,以确保其持续的相关性。它目前包含来自专业事实核查组织的25,000个真实世界声明,涵盖54种语言,并包括文本和视听材料。 AI
影响 为事实核查系统提供了一个更强大的评估框架,这对于在先进LLM时代打击虚假信息至关重要。
排序理由 这是一篇介绍自动化事实核查新基准的研究论文。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →