PulseAugur
实时 01:25:12
实体 4×3090

4×3090

PulseAugur coverage of 4×3090 — every cluster mentioning 4×3090 across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
0
90 天内 0
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_113882 ·

    Nemotron-3-Super-120B-A12B 采用 Mamba+MoE 架构实现 504K token 召回

    NVIDIA 的 Nemotron-3-Super-120B-A12B 模型,一种混合 Mamba 和 Mixture-of-Experts 架构,已展示出高达 504,000 token 的完美召回能力。与传统的 KV 缓存方法相比,该模型利用 Mamba 层来维持恒定的循环状态,显著降低了长上下文相关的计算成本。该模型在拥有约 71GB 显存的四块 3090 GPU 上运行,在扩展上下文长度时实现了令人印象深刻的解码速度,性能优于…