METR的研究人员进行了实验,使用OpenAI的GPT-3.5 Turbo和GPT-4版本来衡量训练后增强对AI代理能力的影响。他们的发现表明,OpenAI自身的训练后工作通过26个百分点的提升显著提高了代理性能,这一增幅与GPT-3.5到GPT-4的提升相当。虽然他们通过调整提示和工具进一步提高代理性能的尝试产生了较小且统计上不显著的增益,但该研究表明,在模型经过有能力的微调后,大幅度提高其危险能力可能具有挑战性,尽管还需要进一步的研究。 AI
排序理由 该集群基于一篇评估AI代理能力和训练后增强影响的研究论文。
在 METR (Model Evaluation & Threat Research) 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →