PulseAugur
实时 23:37:39

新研究重新评估因果方向方法,发现结果被夸大

一篇题为“One Ruler”的新论文重新评估了在Tuebingen数据集上的因果方向方法,认为当前比较存在缺陷,因为采用了不同的协议。作者进行了一项“同一套方法”的重新评估,在没有参数调整的情况下将所有方法应用于相同的102对。他们引入了一个使用排序条件压缩的无参数基线,该基线取得了有竞争力的结果,并指出了测试集模型选择和显著性门控弃权等问题,这些问题夸大了已发表的数据。 AI

影响 这项研究强调了因果方向方法已发表结果可能存在的夸大现象,表明AI研究需要标准化的评估协议。

排序理由 该集群包含一篇学术论文,详细介绍了因果方向研究的新评估方法和基线。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新研究重新评估因果方向方法,发现结果被夸大

报道来源 [1]

  1. arXiv cs.LG TIER_1 English(EN) · Wietse Stienstra ·

    One Ruler: A Same-Hands Re-Evaluation of Bivariate Causal Direction on Tuebingen, with a Parameter-Free Compression Baseline

    arXiv:2606.23767v1 Announce Type: new Abstract: Headline accuracies on the Tuebingen cause-effect pairs are routinely compared across papers even though each is measured under its authors' own protocol -- different pair subsets, weightings, model-selection, and decision rates. We…