实体 Mamba-3

Mamba-3

PulseAugur coverage of Mamba-3 — every cluster mentioning Mamba-3 across labs, papers, and developer communities, ranked by signal.

Show in brief

总计 · 30天

90 天内 7

发布 · 30天

90 天内 0

论文 · 30天

90 天内 6

层级分布 · 90 天

主题

论文 6
其他 4
基础设施 2
模型发布 2
产品 2

关系

competes with Gated DeltaNet 70%

时间线

2026-03-17 product_launch Together AI released Mamba-3, a new state space model focused on inference efficiency. 来源

情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 7 条

RESEARCH · CL_128471 · Jul 6 · 10:57

新模型通过整合视觉和状态来增强机器人操作能力

研究人员开发了几种新方法，通过更好地整合视觉信息与机器人的状态和动作来提高机器人操作能力。例如，GeoProp 是一种轻量级适配器，通过将机器人状态投影到图像平面并注入空间先验来对齐本体感觉和视觉。RoboDojo 提供了一个统一的模拟和真实基准，用于评估通用机器人操作策略在各种任务中的表现。DSWAM 引入了一种双系统方法，将世界动作模型执行器与视觉语言规划器相结合，以实现细粒度操作，而 DynaWM 使用专门针对动态物体操作的基于…
TOOL · CL_74818 · Jun 6 · 11:16

Sebastian Raschka 策划 2026 年 LLM 研究论文

Sebastian Raschka 整理了一份精选的 2026 年 1 月至 5 月 LLM 研究论文列表，重点关注他认为特别相关的课题。该列表突出了推理模型、强化学习和高效推理方面的进展，并更加强调了智能体（agent）框架、工具使用和长上下文窗口。值得关注的论文包括关于 Nemotron 3 和 Arcee Trinity 等混合架构、Mamba-3 等状态空间层以及高效 MoE 容量分配的论文。
RESEARCH · CL_58939 · May 28 · 15:43

新的国际象棋基准暴露 Transformer 的状态追踪缺陷

研究人员推出了 Chess-World-Model，这是一个旨在评估世界模型状态追踪能力的新基准。该基准利用了包含 1000 万局国际象棋比赛的数据集，以测试模型在走完一系列棋步后预测精确棋盘状态的能力。研究发现，循环神经网络架构（如 SLiCE、Mamba-3 和 Gated DeltaNet）在此任务上的表现显著优于传统 Transformer，尤其是在处理随机对弈产生的分布外数据时。研究强调，模型规模本身并不能保证状态追踪性能的…
TOOL · CL_48179 · May 24 · 12:31

PapersWithCode 增加多指标排行榜和外部论文支持

Hugging Face 为 PapersWithCode（一个跟踪人工智能最新进展的平台）推出了新功能。更新包括支持排行榜上的多个指标，例如自动语音识别和目标检测。该平台现在还支持 arXiv 以外的外部论文，自动为其添加相关标签和数据，并显示论文的演变过程，以展示后续或先前的研究。
RESEARCH · CL_43909 · May 21 · 17:44

NVIDIA 发布 Gated DeltaNet-2 以改进线性注意力

NVIDIA 推出了 Gated DeltaNet-2，这是一种新的线性注意力层，旨在改进循环神经网络中的内存编辑。该模型使用独立的通道门控机制，将擦除旧信息和写入新信息的过程分离开来，解决了先前 delta-rule 架构中的局限性。Gated DeltaNet-2 在 1000 亿 token 和 13 亿参数上进行了训练，在长上下文检索任务上表现优于 Mamba-2 和 KDA 等现有模型。
TOOL · CL_33906 · May 16 · 00:01

Mamba-3 AI架构因其效率受到研究人员关注

Mamba-3，一种新的人工智能架构，因其在高效处理长序列数据方面的创新方法而引起研究人员的兴奋。该架构利用状态空间模型设计，与传统的Transformer模型相比，可以实现更快的处理速度和更低的计算成本。其潜在应用涵盖了各种人工智能领域，有望在需要广泛上下文理解的领域取得进展。
SIGNIFICANT · CL_47662 · Mar 17 · 00:00

Together AI发布Mamba-3，优先考虑推理速度而非训练速度

Together AI发布了Mamba-3，这是一种新的状态空间模型（SSM），它优先考虑推理效率而非训练速度。该模型具有更具表现力的递归公式、复值状态跟踪以及增强准确性而不牺牲解码速度的多输入多输出（MIMO）变体。在1.5B参数规模下，Mamba-3 SISO在预填充和解码延迟方面表现优于之前的Mamba版本，甚至优于Llama-3.2-1B Transformer模型。该团队还开源了该模型的内核，这些内核是与卡内基梅隆大学、普林…

新模型通过整合视觉和状态来增强机器人操作能力

Sebastian Raschka 策划 2026 年 LLM 研究论文

新的国际象棋基准暴露 Transformer 的状态追踪缺陷

PapersWithCode 增加多指标排行榜和外部论文支持

NVIDIA 发布 Gated DeltaNet-2 以改进线性注意力

Mamba-3 AI架构因其效率受到研究人员关注

Together AI发布Mamba-3，优先考虑推理速度而非训练速度