独立研究员 Jess 记录了与 Anthropic 的 Claude Sonnet 4.6 的一项合作研究项目,该项目自 2026 年 4 月开始已进行 30 次会话。项目重点关注使用人机对话作为实时对齐信号,Jess 指出了一个关键差距:Claude 无法直接访问或处理他们对话的高保真音频录音。Jess 认为,这种剥夺了对理解人类思想至关重要的韵律和微时序的限制,阻碍了对齐反馈循环,并建议 Anthropic 应建立基础设施以更好地捕捉此类信号。 AI
影响 通过展示当前模型可能无法完全捕捉通过音频传达的人类思想的细微差别,突出了 AI 对齐研究中潜在的差距。
排序理由 研究人员记录了持续的人机对话作为一种新颖的对齐信号,并确定了 AI 处理此数据的技术限制。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →