PulseAugur
实时 23:41:02
English(EN) Gradient-free Single-pass Model Beats nanoGPT on Shakespeare

无梯度EntropyBeam模型在莎士比亚基准测试中优于nanoGPT

一款名为EntropyBeam的新语言模型在nanoGPT莎士比亚基准测试中表现出卓越的性能,其交叉熵低于nanoGPT模型。EntropyBeam在没有可训练参数的情况下运行,通过计算将字符上下文映射到下一个字符频率的计数表,在单通道中完成学习。虽然它比nanoGPT的学习参数(60,192个)存储更多的数据(270万个上下文-转换条目),但它通过加权几何平均值组合多个加权顺序的独特方法实现了更高的准确性。 AI

影响 引入了一种新颖的、无参数的语言建模方法,在字符级任务上取得了有竞争力的结果。

排序理由 该条目描述了一个新的语言模型及其在特定基准测试上的性能,符合研究类别。[lever_c_demoted from research: ic=1 ai=1.0]

在 LessWrong (AI tag) 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

无梯度EntropyBeam模型在莎士比亚基准测试中优于nanoGPT

报道来源 [1]

  1. LessWrong (AI tag) TIER_1 English(EN) · zw5 ·

    Gradient-free Single-pass Model Beats nanoGPT on Shakespeare

    <p><span>Beam is a character-level language model that computes count tables mapping character contexts to next-character frequencies.</span></p><p><span>At prediction time, each order </span><span class="math-tex"></span><span> looks up the current context in its count table and…