Together AI 现已推出 GLM-5.2,据称该模型速度快,能够处理长上下文编码和代理工作负载。该公司强调其优化的服务基础设施,可在 OpenRouter 等平台上实现高吞吐量(TPS)。这一发展凸显了 Together AI 在高效推理方面的专注,以应对严苛的 AI 任务。 AI
影响 加速了 LLM 高效推理的可用性,可能降低 AI 开发者的成本。
排序理由 这是一个来自非前沿模型实验室公司的工具/基础设施公告,关于一个未明确声明为新模型的模型。
在 X — Together (inference / OSS) 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →