人工智能初创公司 Subquadratic 声称,其新的 SubQ 架构克服了大型语言模型领域一个长达十年的瓶颈。该公司声称 SubQ 更快、更便宜、更节能,能够处理比当前模型多得多的文本,同时在关键任务上与 Google DeepMind、OpenAI 和 Anthropic 的领先大型语言模型相媲美。最初的怀疑因 Appen 的独立评估而有所缓解,这些评估表明 SubQ 在特定数据密集型任务上提高速度和效率的主张可能是有效的,这可能预示着大型语言模型发展的新时代。 AI
影响 可能显著降低大型语言模型的训练和推理成本,并可能促使行业摆脱 Transformer 架构。
排序理由 初创公司声称拥有新的大型语言模型架构,克服了已知的瓶颈,并得到第三方评估的支持。[lever_c_demoted from research: ic=1 ai=1.0]
- Alex Whedon
- Anthropic
- Appen
- Dan McAteer
- Google DeepMind
- Jeanine Sinanan-Singh
- OpenAI
- SubQ LLM
- transformer
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →