一位 Reddit 用户使用开源模型 Qwen3.5-35b 复现了 Anthropic 的“Golden Gate Claude”实验。该用户改编了 Anthropic 的“模型引导”方法,创建了自己的版本,并将其命名为“Golden Gate Golf”。他们指出,由于模型规模较小且缺乏人类反馈强化学习(RLHF),他们的模型不如 Claude 精炼。 AI
影响 证明了模型引导技术可以适应更小的开源模型。
排序理由 用户主导复现了之前的研究实验,使用了开源模型。 [lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →