实体 Beneficial RL

Beneficial RL

PulseAugur coverage of Beneficial RL — every cluster mentioning Beneficial RL across labs, papers, and developer communities, ranked by signal.

总计 · 30天

1

90 天内 1

发布 · 30天

0

90 天内 0

论文 · 30天

0

90 天内 0

层级分布 · 90 天

主题

情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条

RESEARCH · CL_99342 · Jun 18 · 21:34

OpenAI 训练 AI 模型以实现跨领域的持续有益行为

OpenAI 发布了一项关于新方法的 ist 研究，该方法旨在训练 AI 模型在各种情况下并在对抗压力下保持有益的特质。这种方法称为有益强化学习 (Beneficial RL)，在现实对话中使用强化学习来灌输真诚、谦逊和公平等品质。早期测试表明，通过此方法训练的模型在各种领域（即使是那些未明确包含在训练数据中的领域）都显示出更好的对齐和安全性，并能更好地抵御有害提示。