Subquadratic Inc. 发布了 SubQ,这是一款新推出的长上下文语言模型,声称能够一次性处理整个代码库或文档集。该模型采用了亚二次方稀疏注意力设计,理论上允许计算量与上下文长度呈线性扩展,而非二次方。虽然供应商发布的基准测试在长上下文检索方面显示出有希望的结果,但据报道,与前沿模型相比,其编码能力一般。该模型目前处于私有测试阶段,可通过与 OpenAI 兼容的 REST API 访问,标称上限为 1200 万个 token,但迄今为止的评估仅限于 100 万个 token。 AI
影响 通过消除传统的 RAG 限制,可能为代码分析和文档处理带来新的工作流程。
排序理由 初创公司发布的新模型,声称拥有新颖的架构和性能指标。[lever_c_demoted from frontier_release: ic=1 ai=1.0]
- Alex Whedon
- Claude Opus
- Flashattention
- Justin Dangel
- May 5, 2026
- MRCR v2
- OpenAI
- Python
- SubQ LLM
- subq-preview
- Subquadratic Inc.
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →