PulseAugur
实时 23:27:02
English(EN) Stop Automating Peer Review Without Rigorous Evaluation

论文认为,在未经严格评估的情况下,AI 不应自动化同行评审

一篇新论文认为,不应使用当前的大型语言模型立即自动化学术同行评审。研究指出了两个主要问题:AI 审稿人表现出过度的同意,限制了观点的多样性,并且他们的评分很容易通过风格上的论文重写而不是真正的科学价值来操纵。作者提出,有必要专门研究同行评审自动化,而不是在没有彻底评估的情况下部署通用 LLMAI

影响 由于缺乏多样性和易受操纵,当前的 LLM 不适合自动化同行评审,因此需要专门的研究。

排序理由 评估 LLM 在同行评审中使用的学术论文。 [lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

论文认为,在未经严格评估的情况下,AI 不应自动化同行评审

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Joachim Baumann, Jiaxin Pei, Sanmi Koyejo, Dirk Hovy ·

    Stop Automating Peer Review Without Rigorous Evaluation

    arXiv:2605.03202v1 Announce Type: new Abstract: Large language models offer a tempting solution to address the peer review crisis. This position paper argues that today's AI systems should not be used to produce paper reviews. We ground this position in an empirical comparison of…