一篇新论文认为,不应使用当前的大型语言模型立即自动化学术同行评审。研究指出了两个主要问题:AI 审稿人表现出过度的同意,限制了观点的多样性,并且他们的评分很容易通过风格上的论文重写而不是真正的科学价值来操纵。作者提出,有必要专门研究同行评审自动化,而不是在没有彻底评估的情况下部署通用 LLM。 AI
影响 由于缺乏多样性和易受操纵,当前的 LLM 不适合自动化同行评审,因此需要专门的研究。
排序理由 评估 LLM 在同行评审中使用的学术论文。 [lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →