研究人员开发了一个名为IntraGuard的新防御框架,以打击在学术同行评审中滥用大型语言模型(LLMs)的行为。该系统在手稿中嵌入隐藏指令,这些指令会干扰或改变AI生成的评审,从而阻止审稿人将工作完全外包给聊天机器人。IntraGuard通过在PDF结构中插入异构防御文本对象来实现这一点,而不会改变其视觉外观,在各种场合和聊天机器人设置下实现了高达84%的防御成功率。 AI
影响 引入了一种新颖的防御AI驱动的学术不端行为的方法,有可能维护同行评审的完整性。
排序理由 该集群包含一篇学术论文,详细介绍了针对同行评审中AI滥用的新防御机制。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →