PulseAugur
实时 07:15:55
实体 Parshin Shojaee

Parshin Shojaee

PulseAugur coverage of Parshin Shojaee — every cluster mentioning Parshin Shojaee across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_17750 ·

    苹果研究人员探究大型推理模型的思考极限

    研究人员引入了一个名为“思考的幻觉”的新框架,以更好地理解大型推理模型(LRM)的推理能力和局限性。该框架利用可控的谜题环境来分析LRM的内部推理过程,超越了仅关注最终答案准确性的传统评估方法。实验表明,LRM在问题复杂度高时会出现完全的准确率崩溃,并表现出一种奇怪的扩展极限,即尽管计算资源充足,推理努力却会减少。