新研究重新评估因果方向方法，发现结果被夸大

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-24 04:00

一篇题为“One Ruler”的新论文重新评估了在Tuebingen数据集上的因果方向方法，认为当前比较存在缺陷，因为采用了不同的协议。作者进行了一项“同一套方法”的重新评估，在没有参数调整的情况下将所有方法应用于相同的102对。他们引入了一个使用排序条件压缩的无参数基线，该基线取得了有竞争力的结果，并指出了测试集模型选择和显著性门控弃权等问题，这些问题夸大了已发表的数据。 AI

影响这项研究强调了因果方向方法已发表结果可能存在的夸大现象，表明AI研究需要标准化的评估协议。

排序理由该集群包含一篇学术论文，详细介绍了因果方向研究的新评估方法和基线。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Wietse Stienstra · 2026-06-24 04:00

One Ruler: A Same-Hands Re-Evaluation of Bivariate Causal Direction on Tuebingen, with a Parameter-Free Compression Baseline

arXiv:2606.23767v1 Announce Type: new Abstract: Headline accuracies on the Tuebingen cause-effect pairs are routinely compared across papers even though each is measured under its authors' own protocol -- different pair subsets, weightings, model-selection, and decision rates. We…

报道来源 [1]

One Ruler: A Same-Hands Re-Evaluation of Bivariate Causal Direction on Tuebingen, with a Parameter-Free Compression Baseline

相关实体

相关话题