English(EN) Summarizing books with human feedback

OpenAI利用人类反馈和任务分解来改进AI总结

作者 PulseAugur 编辑部 · [2 个来源] · 2020-09-04 07:00

OpenAI开发了一种新的方法来使AI模型与人类意图保持一致，重点解决了评估书籍总结等复杂任务输出的挑战。他们的方法采用递归任务分解，将整本书的总结分解成更小、更易于管理的部分。这使得人类评估者能够更有效地提供反馈，即使原始材料非常广泛。经过微调的GPT-3模型表现出色，其质量可与人类撰写的总结相媲美，并在书籍长度总结和问答任务方面树立了新的标杆。 AI

排序理由这篇研究论文详细介绍了一种使用人类反馈和递归任务分解进行AI对齐和总结的新方法。

在 OpenAI News 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

OpenAI News TIER_1 English(EN) · 2021-09-23 07:00

Summarizing books with human feedback

Scaling human oversight of AI systems for tasks that are difficult to evaluate.
OpenAI News TIER_1 English(EN) · 2020-09-04 07:00

Learning to summarize with human feedback

We’ve applied reinforcement learning from human feedback to train language models that are better at summarization.

报道来源 [2]

Summarizing books with human feedback

Learning to summarize with human feedback

相关话题