研究人员发现了一个在检测机器生成文本时存在的重大问题,该问题源于一种类似于辛普森悖论的现象。当前方法对token得分进行平均,这掩盖了检测器模型隐藏空间中非均匀的信号。一种新方法引入了一个学习到的局部校准步骤,通过聚合校准后的对数似然比而不是原始得分来提高检测准确性。该方法显著提升了性能,其中一个变体在GPT-5.4文本上的AUROC从0.63提高到0.85。 AI
影响 提高了区分AI生成文本的可靠性,这对于打击虚假信息和确保真实性至关重要。
排序理由 学术论文,提出了一种检测机器生成文本的新颖方法。
AI 生成摘要 · Google Gemini · 来自 3 个来源。 我们如何撰写摘要 →