Together AI 宣布了其推理能力的重大改进,实现了每次交互成本降低六倍和 p95 延迟低于 400 毫秒。该公司还致力于每周发布新模型,表明了快速的开发和部署周期。 AI
影响 加速了为开发者和研究人员提供更具成本效益和更快的 AI 模型。
排序理由 该项目详细介绍了 AI 基础设施提供商的技术改进和发布节奏,符合研究/基础设施类别。[lever_c_降级自研究:ic=1 ai=0.7]
在 X — Together (inference / OSS) 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →