PulseAugur
实时 17:21:06
English(EN) My unsupervised elicitation challenge

Claude Opus 4.7 掌握古希腊语填空挑战

一位AI对齐研究员向Claude Opus 4.6发出了一个挑战,要求它在无人协助的情况下正确完成古希腊语填空练习。该模型在重音规则上遇到了困难,这是大型语言模型在专业语言任务中普遍存在的问题。虽然最初引导Opus 4.6的尝试只取得部分成功,但稍后的版本Opus 4.7能够一次性解决该挑战。 AI

排序理由 该集群描述了研究员提出的一个挑战及其后续结果,这符合研究导向内容的特点。

在 Alignment Forum 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

Claude Opus 4.7 掌握古希腊语填空挑战

报道来源 [2]

  1. Alignment Forum TIER_1 English(EN) · DanielFilan ·

    我的无监督诱导挑战

    <p><em>Note: you are ineligible to complete this challenge if you’ve studied Ancient or Modern Greek, or if you natively speak Modern Greek, or if for other reasons you know what mistakes I’m claiming Opus 4.6 makes. If you’re ineligible, please don’t help other people complete t…

  2. LessWrong (AI tag) TIER_1 English(EN) · DanielFilan ·

    我对无监督诱导挑战的回顾

    <p><em>This post contains spoilers for the unsupervised elicitation challenge of getting Claude to get my Ancient Greek homework right.</em></p> <p>tl;dr Opus 4.7 one-shots it, nothing else worked.</p> <h2>The challenge</h2> <p>A few weeks ago, I announced to the world my Unsuper…