PulseAugur
实时 10:20:45
实体 Hojin Kim

Hojin Kim

PulseAugur coverage of Hojin Kim — every cluster mentioning Hojin Kim across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_70341 ·

    研究人员发现AI推理指标未能捕捉逻辑

    研究人员发现,常用于评估AI模型推理质量的概率置信度指标可能无法准确反映真实的推理能力。他们的实验表明,这些指标在很大程度上对逻辑结构不敏感,反而捕捉的是表面流畅性或先验知识。为解决此问题,该团队开发了一种新的对比因果关系指标,旨在更好地分离和衡量推理中的步骤间因果依赖关系。