PulseAugur
实时 07:02:43
实体 Caspar Oesterheld

Caspar Oesterheld

PulseAugur coverage of Caspar Oesterheld — every cluster mentioning Caspar Oesterheld across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_97624 ·

    使用一致性指标测试语言模型的哲学能力

    Caspar Oesterheld 进行了一项初步实验,探索使用跨不同问题的一致性作为衡量语言模型哲学能力的指标。希望一致性能够作为一种可靠且可扩展的奖励信号,用于在难以直接评估的概念领域中训练模型。该实验包括对 LMCA 数据集中的批评进行简单的改写,并关联模型对这些变化的响应。