PulseAugur
实时 16:51:12
实体 RWKV-7

RWKV-7

PulseAugur coverage of RWKV-7 — every cluster mentioning RWKV-7 across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
情绪 · 30 天

2 天有情绪数据

最近 · 第 1/1 页 · 共 2 条
  1. TOOL · CL_44790 ·

    WriteSAE 可直接操控循环语言模型状态

    研究人员开发了 WriteSAE,这是一种新颖的稀疏自编码器,旨在操控循环语言模型状态内的矩阵更新。该方法学习秩-1 矩阵原子,直接替换模型自身的矩阵更新,在最终标记分布准确性方面显示出显著的改进。该技术已成功应用于 Gated DeltaNet 和 Mamba-2 等模型,展示了其在引导模型生成和理解内部状态动态方面的潜力。

  2. TOOL · CL_42512 ·

    新方法加速线性 Transformer 的三角求逆

    研究人员开发了一种新的三角求逆方法,这是 Qwen3.5/3.6 和 Kimi Linear 等高级模型使用的线性注意力机制中的关键操作。该技术显著提高了该子例程的速度和数值稳定性,而该子例程通常是性能瓶颈。实验表明,与现有实现相比,在 NPU 上速度提高了 4.3 倍,从而在不牺牲准确性的情况下实现了整体层性能的提升。