实体 Subquadratic Sparse Attention

Subquadratic Sparse Attention

PulseAugur coverage of Subquadratic Sparse Attention — every cluster mentioning Subquadratic Sparse Attention across labs, papers, and developer communities, ranked by signal.

Show in brief

总计 · 30天

90 天内 2

发布 · 30天

90 天内 0

论文 · 30天

90 天内 0

层级分布 · 90 天

主题

情绪 · 30 天

2 天有情绪数据

最近 · 第 1/1 页 · 共 2 条

SIGNIFICANT · CL_95036 · Jun 16 · 14:50

SubQ 发布 SubQ 1.1 Small，拥有 1200 万 token 上下文和稀疏注意力

SubQ 发布了其 SubQ 1.1 Small 模型，该模型采用了一种新的亚二次稀疏注意力（SSA）架构，旨在克服传统注意力机制的二次方扩展限制。这种新架构显著降低了计算需求，能够处理更长的上下文。在“针尖麦芒”测试中，该模型在高达 1200 万 token 的上下文长度下表现出近乎完美的检索能力，并在通用知识和编码基准测试中表现强劲，同时所需的计算量远低于密集注意力和 FlashAttention-2。
RESEARCH · CL_44253 · May 22 · 13:58

SubQ LLM发布更快的注意力机制以处理长文本

SubQ LLM推出了一种名为Subquadratic Sparse Attention (SSA)的新架构，旨在更高效地处理长文本。这一进步使AI模型能够处理更多信息，有可能改变当前的AI应用。

SubQ 发布 SubQ 1.1 Small，拥有 1200 万 token 上下文和稀疏注意力

SubQ LLM发布更快的注意力机制以处理长文本