PulseAugur
实时 00:56:50
实体 Beneficial RL

Beneficial RL

PulseAugur coverage of Beneficial RL — every cluster mentioning Beneficial RL across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
0
90 天内 0
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_99342 ·

    OpenAI 训练 AI 模型以实现跨领域的持续有益行为

    OpenAI 发布了一项关于新方法的 ist 研究,该方法旨在训练 AI 模型在各种情况下并在对抗压力下保持有益的特质。这种方法称为有益强化学习 (Beneficial RL),在现实对话中使用强化学习来灌输真诚、谦逊和公平等品质。早期测试表明,通过此方法训练的模型在各种领域(即使是那些未明确包含在训练数据中的领域)都显示出更好的对齐和安全性,并能更好地抵御有害提示。