Together AI 推出自适应 LLM 推理系统 ATLAS

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-22 15:59

Together AI 推出了 ATLAS，一个新颖的自适应学习系统，用于推测性解码，可在无需手动调整的情况下动态提高 LLM 推理性能。与标准或自定义推测器不同，ATLAS 可持续从运行时使用和不断变化的工作负载中学习，以实时优化 token 草稿。该系统实现了显著的加速，在 DeepSeek-V3.1 上达到高达 500 TPS，在 Kimi-K2 上达到 460 TPS，甚至超越了 Groq 等专用硬件。 AI

影响通过动态优化推测性解码来加速 LLM 推理速度并降低成本。

排序理由 LLM 新颖推理优化技术的产品发布。[lever_c_demoted from significant: ic=1 ai=1.0]

在 Together AI blog 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

Together AI blog TIER_1 Türkçe(TR) · 2026-05-22 15:59

AdapTive

LLM inference that gets faster as you use it. Our runtime-learning accelerator adapts continuously to your workload, delivering 500 TPS on DeepSeek-V3.1, a 4x speedup over baseline performance without manual tuning.

报道来源 [1]

AdapTive

相关实体

相关话题