一篇题为“One Ruler”的新论文重新评估了在Tuebingen数据集上的因果方向方法,认为当前比较存在缺陷,因为采用了不同的协议。作者进行了一项“同一套方法”的重新评估,在没有参数调整的情况下将所有方法应用于相同的102对。他们引入了一个使用排序条件压缩的无参数基线,该基线取得了有竞争力的结果,并指出了测试集模型选择和显著性门控弃权等问题,这些问题夸大了已发表的数据。 AI
影响 这项研究强调了因果方向方法已发表结果可能存在的夸大现象,表明AI研究需要标准化的评估协议。
排序理由 该集群包含一篇学术论文,详细介绍了因果方向研究的新评估方法和基线。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →