PulseAugur
实时 11:47:57
实体 CoT-Space

CoT-Space

PulseAugur coverage of CoT-Space — every cluster mentioning CoT-Space across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_72678 ·

    CoT-Space框架通过RL优化解释LLM推理

    研究人员引入了CoT-Space,一个旨在更好地理解大型语言模型(LLM)内部推理过程的新理论框架。该框架将通常由强化学习(RL)增强的多步思维链(CoT)推理,从一个简单的token预测任务重新构建为一个在连续语义空间内的优化问题。该模型解释了最优CoT长度如何从欠拟合和过拟合之间的权衡中产生,为内部测试时扩展提供了机制性解释。