Inception Labs 发布了 Mercury 2,这是一款能够以每秒超过 1000 个 token 的速度进行推理和生成文本的新型扩散模型。该模型通过使用并行结晶而非线性写入,实现了显著的速度提升,与传统模型相比,延迟降低了 82%。Mercury 2 在基准测试中也超越了 Google 的 DiffusionGemma,对传统的 LLM 架构提出了挑战。 AI
影响 以其并行结晶方法为 LLM 推理速度设定了新基准,并对现有架构提出了挑战。
排序理由 前沿实验室模型发布,附带系统卡。
在 Mastodon — mastodon.social 阅读 →
AI 生成摘要 · Google Gemini · 来自 3 个来源。 我们如何撰写摘要 →