METR的研究人员进行了实验,以衡量训练后增强对AI代理能力的影响。他们的发现表明,OpenAI自身对GPT-4进行的训练后工作使代理性能显著提高了26个百分点,这一提升与从GPT-3.5 Turbo到GPT-4的飞跃相当。虽然研究人员自己进一步提高代理性能的尝试带来的收益较小,且在统计学上不显著,但他们认为,在模型经过称职的代理微调后,实现显著的能力提升可能很困难。 AI
影响 表明开发者的训练后增强可以显著提升AI代理性能,可能影响安全评估。
排序理由 该集群描述了一篇评估AI代理能力和训练后增强影响的研究论文。
在 METR (Model Evaluation & Threat Research) 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →