PulseAugur
实时 10:05:43
实体 CNN/DailyMail

CNN/DailyMail

PulseAugur coverage of CNN/DailyMail — every cluster mentioning CNN/DailyMail across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_04682 ·

    Eugene Yan 探讨生成式摘要的评估挑战及幻觉检测

    对生成式摘要(即非逐字复制原文句子,而是进行意译重述)的评估存在挑战,尤其是在衡量相关性和事实一致性方面。虽然现代语言模型在流畅性和连贯性方面已基本解决问题,但相关性的衡量仍然主观。事实不一致性,即幻觉的检测是关键焦点,研究表明生成摘要存在显著的错误率,例如在CNN/DailyMail数据集上高达30%。常见的评估方法包括基于n-gram的指标(如ROUGE)和基于嵌入的指标,以及用于幻觉检测的自然语言推理和问答技术。