实体
Chain-of-Thought (CoT)
Chain-of-Thought (CoT)
PulseAugur coverage of Chain-of-Thought (CoT) — every cluster mentioning Chain-of-Thought (CoT) across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
情绪 · 30 天
2 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
LLM推理有效性由熵动力学预测
研究人员开发了一个名为EDRM的新框架,该框架利用早期熵动力学来确定大型语言模型(LLM)何时应进行显式推理。他们观察到,受益于思维链(CoT)推理的任务在生成过程中熵会持续降低,这表明模型已切换到结构化推理状态。EDRM利用这种熵降低信号来适应性地选择推理策略,从而在各种基准测试和LLM上显著减少了token数量并提高了准确性。
-
小型LLM使用位置复制捷径进行算术,绕过CoT逻辑
一篇新的研究论文揭示了小型语言模型在使用链式思考(CoT)提示执行算术任务时存在一个重要的捷径。这些模型倾向于复制答案分隔符之前的位置数字,而不是依赖逻辑排序,即使中间的推理步骤不正确或被打乱,这种位置复制也能解释其准确性的很大一部分,这突显了评估CoT忠实度时潜在的故障模式。