实体
Fever
Fever
PulseAugur coverage of Fever — every cluster mentioning Fever across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
情绪 · 30 天
1 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
新的审计协议测试NLP基准的证据依赖性
研究人员为自然语言处理中的弱标签基准开发了一种新的审计协议。该协议区分了仅凭元数据即可预测的输出与真正依赖于所提供证据的输出。通过结合元数据先验主导得分和证据干预统计量,该方法旨在提供对基准可靠性更稳健的评估。
-
AtomEval framework improves fact-checking evaluation of adversarial claims
Researchers have introduced AtomEval, a new framework designed to more accurately evaluate adversarial claims used in fact-checking systems. Unlike existing metrics that focus on surface similarity, AtomEval decomposes …