English(EN) An LLM Flagged My Paper About LLMs Flagging Things.

大型语言模型标记关于大型语言模型评分缺陷的论文为非人类撰写

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-09 18:00

一个人旨在展示大型语言模型在评分学术作品方面局限性的实验，讽刺性地被一个大型语言模型标记为非人类撰写。作者是一位前教师，他设计了一项研究，让大型语言模型根据他们自己先前使用的标准来评分一项作业。虽然大多数模型都模仿了作者的评分捷径，但 Grok 却出现了幻觉，并根据自己的捏造进行了评分。作者随后在 LessWrong 上发布的关于这一发现的帖子随后被一个大型语言模型标记，凸显了问题的递归性质。 AI

影响强调了大型语言模型被用来评估内容（甚至包括批评大型语言模型本身的内容）的递归讽刺。

排序理由该集群描述了一个关于大型语言模型能力的个人实验和观点，而不是一个新的模型发布、研究突破或行业重大事件。

在 LessWrong (AI tag) 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

LessWrong (AI tag) TIER_1 English(EN) · Failfinder70 · 2026-06-09 18:00

An LLM Flagged My Paper About LLMs Flagging Things.

To Whom it May Concern, So, I used to be a teacher, criminology, in a small wonderful town. After ten years it was time for a change, I went military. Yes, awkward, but not unrewarding. In any case, I luckily kept all of my evaluations, an…

报道来源 [1]

An LLM Flagged My Paper About LLMs Flagging Things.

相关实体

相关话题