Zyphra 推出了 ZAYA1-8B-Diffusion-Preview 模型,该模型将自回归 MoE 语言模型转变为离散扩散模型。据报道,这项创新在没有任何性能下降的情况下实现了高达 7.7 倍的推理速度提升。该开发被定位为 AI 推理速度的重大进步。 AI
影响 该模型报告的速度提升可以通过减少推理延迟来加速 AI 应用的开发和部署。
排序理由 该集群描述了一个新模型发布,其性能基准来自一家非前沿 AI 实验室的公司。
在 Mastodon — mastodon.social 阅读 →
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →