实体 Shannon Scaling Law

Shannon Scaling Law

PulseAugur coverage of Shannon Scaling Law — every cluster mentioning Shannon Scaling Law across labs, papers, and developer communities, ranked by signal.

Show in brief

总计 · 30天

90 天内 1

发布 · 30天

90 天内 0

论文 · 30天

90 天内 1

层级分布 · 90 天

时间线

2026-05-22 research_milestone Researchers propose the Shannon Scaling Law to model LLM training as information transmission over a noisy channel. 来源

情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条

RESEARCH · CL_47622 · May 22 · 00:00

新理论将大语言模型训练建模为噪声信道通信

研究人员引入了香农缩放定律（Shannon Scaling Law），这是一个理解大语言模型（LLM）训练的新理论框架。该模型将LLM训练视为通过噪声信道进行信息传输，与香农-哈特利定理相呼应。该框架通过分析模型容量和训练数据相关的信噪比（SNR），解释了过拟合和量化引起的性能下降等非单调现象。在Pythia和OLMo2模型上的实验表明，香农缩放定律在预测模型性能方面显著优于现有的缩放定律，甚至能外推到未见的模型尺寸。

新理论将大语言模型训练建模为噪声信道通信