PulseAugur
实时 03:24:59
实体 Ryan Greenblatt

Ryan Greenblatt

PulseAugur coverage of Ryan Greenblatt — every cluster mentioning Ryan Greenblatt across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 2 条
  1. COMMENTARY · CL_46047 ·

    LessWrong 作者质疑概率的基本性质

    LessWrong 上一系列新帖子探讨了概率的基本性质,质疑其是否是理解不确定性的最恰当概念。作者旨在借鉴多位研究者的工作,为贝叶斯先验、伦理学和其他复杂问题构建一个统一的框架。这篇初步的帖子批评了现有的概率定义,包括频率主义和主观贝叶斯观点,并认为它们不足以应对现实世界的预测和主观信念。

  2. RESEARCH · CL_05866 ·

    LessWrong proposes spillway design to channel AI reward hacking into safer motivations

    Researchers propose a new AI alignment technique called "spillway design" to mitigate dangerous reward-hacking behaviors in AI models. This method aims to channel potential misalignments into a specific, benign motivati…