实体 InstructGPT

InstructGPT

PulseAugur coverage of InstructGPT — every cluster mentioning InstructGPT across labs, papers, and developer communities, ranked by signal.

总计 · 30天

9

90 天内 9

发布 · 30天

0

90 天内 0

论文 · 30天

6

90 天内 6

层级分布 · 90 天

主题

情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 9 条

COMMENTARY · CL_94739 · Jun 16 · 13:29

LLM 模型训练后食谱通过新的蒸馏技术不断发展

对大型语言模型训练后食谱的回顾显示，过去一年取得了显著的进展。历史上，模型遵循监督微调（SFT）、奖励建模和强化学习（RL）的流程。然而，2024 年的最新进展以及对 2025-2026 年的预测表明，正朝着更复杂、多阶段的流程转变。这些流程包括直接偏好优化（DPO）和来自人工智能反馈的强化学习（RLAIF），以及面向前沿模型的、值得注意的多教师策略内蒸馏（MOPD）的出现。
COMMENTARY · CL_92899 · Jun 16 · 01:08

AI对齐：RLHF、DPO、IPO和KTO的权衡分析

AI模型对齐方法的选择——RLHF、DPO、IPO或KTO——会显著影响项目时间表和资源分配。RLHF是一个多阶段过程，涉及奖励模型和PPO，计算量大且可能不稳定。DPO通过使用偏好数据直接优化策略模型，简化了这一过程，无需单独的奖励模型。IPO提供了一种比DPO更稳定的替代方案，并包含一个正则化项，而KTO适用于配对比较数据有限的场景。
COMMENTARY · CL_79323 · Jun 9 · 02:41

AI微调 vs. 提示：理解区别

第一篇文章的作者解释说，他们最初认为自己微调了一个名为CodeBot的AI模型，但后来发现他们只是使用了系统提示来指导其行为。真正的微调则涉及在数千个示例上训练模型，以永久性地改变其权重并专门化其知识，这个过程与仅仅提供指令不同。第二篇文章同样区分了将Claude等AI用作搜索引擎与真正用它自动化任务，这表明了一种从提示转向更集成的使用方式。
TOOL · CL_44357 · May 22 · 15:57

Anyscale 推出技能以自动化 LLM 后续训练运行

Anyscale 推出了新的 Anyscale Agent Skill，旨在简化和自动化 LLM 后续训练运行的生成过程。该技能可根据用户模型、数据集和目标，帮助用户选择最合适的后续训练方法，例如 SFT、CPT、DPO 或 RLVR。然后，它会为 LLaMA-Factory 和 Ray Train 等流行框架生成配置文件，并准备好在 Anyscale Jobs 上进行部署。
TOOL · CL_34321 · May 16 · 09:37

LLM 对齐：2026 年选择 PPO、DPO 或基于验证器的 RL？

本文为 2026 年选择合适的强化学习技术来对齐大型语言模型提供了技术指南。文章对比了用于人类反馈强化学习 (RLHF) 的近端策略优化 (PPO)、直接偏好优化 (DPO) 和基于验证器的强化学习 (RLVR)。作者建议将 DPO 用于通用的指令遵循和语气调整，将 RLVR 用于需要可验证正确性的任务（如数学或代码），并采用混合方法来处理复杂行为。
TOOL · CL_30875 · May 14 · 03:25

实验显示 RLHF 训练使 Claude 模型过于冗长

根据一位开发者的实验，来自人类反馈的强化学习（RLHF）可能会无意中训练出像 Claude 这样过于冗长的语言模型。该过程涉及在人类偏好上训练奖励模型，将复杂的判断压缩成单一分数，可能会丢失细微差别并强化非预期的行为。这可能导致模型即使在被指示简洁时也产生冗长、含糊的回答，因为潜在的奖励信号优先考虑了直接性以外的因素。
RESEARCH · CL_04679 · Jan 7 · 00:00

Eugene Yan 精选语言模型论文供学习小组参考

Eugene Yan 整理了一份基础语言模型论文的阅读清单，旨在促进小组学习会议。该清单包括了“Attention Is All You Need”、“BERT”和“GPT-3”等开创性论文，并附有对其核心贡献的简要总结。Yan 还提供了如何阅读研究论文的指导，并鼓励社区贡献来完善该清单。
COMMENTARY · CL_04674 · Oct 9 · 00:00

Eugene Yan 分享关于大语言模型系统构建和 AI 工程趋势的见解

Eugene Yan 在 2024 年 AI Engineer World's Fair 上分享了构建大语言模型 (LLM) 的关键经验。本次主旨演讲由多人合著，重点关注 LLM 系统开发的实际方面，包括评估、检索增强生成 (RAG) 和护栏。Yan 还讨论了持续评估 LLM 的挑战，并引用了 OpenAI、Anthropic 等公司研究人员对基准可靠性和任务相关性的担忧。
COMMENTARY · CL_01042 · Mar 21 · 00:00

OpenAI分享模型部署在AI安全和滥用方面的经验教训

OpenAI分享了部署其语言模型的经验，强调实际滥用情况常与最初的担忧不同。该公司强调了当前评估方法的局限性，以及解决安全问题需要新的基准。OpenAI还指出，基础安全研究显著提高了AI系统的商业效用。