Together AI
PulseAugur coverage of Together AI — every cluster mentioning Together AI across labs, papers, and developer communities, ranked by signal.
- uses Nvidia Blackwell B200 90%
- founded Vipul Ved Prakash 90%
- developed Together Code Interpreter 90%
- developed Gemma-4-31B-it-Pearl 90%
- uses Deepgram 90%
- partners with Pearl Research Labs 90%
- used by DeepSeek-R1 70%
- affiliated with Nvidia Blackwell B200 70%
- instance of Qwen 70%
- used by Together Code Interpreter 70%
- used by Zoom 70%
- uses RiMe. Rivista dell'Istituto di Storia dell'Europa Mediterranea 70%
- 2026-05-22 product_launch Together AI launched updates to its Fine-Tuning Platform, adding support for new LLMs and extending context lengths. 来源
- 2026-05-22 product_launch Together AI announced the addition of 1,000 NVIDIA H100 and H200 GPUs to its infrastructure. 来源
- 2026-05-22 product_launch Together AI launches GPU clusters with NVIDIA Blackwell platform and optimized kernel collection, achieving significant performance gains. 来源
- 2026-05-22 product_launch Together AI released FlashAttention-3 and FlashAttention-4, optimized attention mechanisms for GPUs. 来源
- 2026-05-22 product_launch Together AI launched major upgrades to its Batch Inference API. 来源
- 2026-05-22 product_launch Together AI launched access to the Qwen3.7-Max model. 来源
- 2026-05-15 partnership Together AI and Pearl Research Labs formed a partnership to integrate blockchain for AI inference cost reduction. 来源
- 2026-05-14 research_milestone Together AI's speech-to-text models achieved top rankings for transcription speed on a benchmark leaderboard. 来源
- 2026-05-08 product_launch Together AI launched a new feature enabling deployment of any Hugging Face model via their Dedicated Container Inference infrastructure using the Goose CLI agent. 来源
- 2026-04-30 research_milestone Together AI details its rapid response and mitigation strategy for the Copy Fail Linux kernel vulnerability. 来源
- 2026-04-30 partnership Together AI announced a partnership with Adaption to integrate their data optimization and model fine-tuning services. 来源
- 2026-03-26 research_milestone Together AI researchers published a framework for using smaller LLMs on long context tasks. 来源
- 2026-03-18 product_launch Together AI launched an enhanced fine-tuning service with support for tool calls, reasoning, and vision-language models. 来源
- 2026-03-16 product_launch Together AI announced new integrations and product offerings at NVIDIA GTC 2026.
- 2026-03-10 product_launch Together AI introduced significant enhancements to its GPU clusters, including multi-tenancy, autoscaling, observability, and self-healing features. 来源
11 天有情绪数据
Together AI to announce enterprise-focused cloud offering within 90 days
The recent launch of self-service GPU clusters and the ATLAS inference system, combined with enhanced fine-tuning capabilities and a brand refresh emphasizing 'builders', suggests Together AI is positioning itself for a more robust enterprise offering. These services are foundational for enterprise AI development and deployment, indicating a strategic move towards capturing a larger market share.
Together AI's ATLAS system shows strong performance against specialized hardware
The reported performance of Together AI's ATLAS system, achieving up to 500 TPS on DeepSeek-V3.1 and outperforming specialized hardware like Groq, is a significant technical achievement. This suggests their adaptive inference approach is highly effective and could set a new benchmark for LLM inference speed and efficiency.
Together AI to integrate NVIDIA Blackwell features into all core services
The 90% training speed boost achieved with NVIDIA Blackwell and custom kernels indicates a deep integration. It's likely Together AI will leverage Blackwell's capabilities across their entire platform, including their new instant clusters and fine-tuning services, to offer a performance edge over competitors.
-
Together AI 品牌重塑,专注于高效 AI 推理基础设施
Together AI 已推出品牌重塑,强调其作为专为 AI 原生应用构建者设计的“AI 原生云”的角色。该公司正专注于优化推理效率和成本效益,这是快速扩展的 AI 产品的一个关键因素。他们正在将自适应推测解码和量化技术等先进研究整合到其平台中,以提高 Cursor 和 Decagon 等客户的性能并降低成本。
-
Cursor 和 Together AI 使用 NVIDIA Blackwell 优化 AI 编码助手
Cursor 是一个由 AI 驱动的编码平台,已与 Together AI 合作优化其实时推理能力。此次合作的重点是在编辑器的反馈循环中实现低延迟响应,这对于 AI 的预测和重构功能至关重要。该合作伙伴关系利用 NVIDIA 的 Blackwell 架构,特别是 GB200 NVL72,来提高性能并缩短开发者的响应时间。
-
多节点训练赋能跨 GPU 集群扩展基础模型
训练大型基础模型需要将工作负载分布到多台互联机器上的众多 GPU 上,这一过程称为多节点训练。这种方法对于处理参数量达数十亿甚至数万亿、超出单台服务器内存容量且否则需要数月才能完成训练的模型至关重要。有效得多节点训练依赖于复杂的并行策略、高速网络互连和强大的容错机制,以确保计算的高效性和进展。
-
指南详述为生产环境选择开源AI模型的考量
为生产环境选择合适的开源AI模型需要仔细考虑透明度、适应性和控制权等因素。虽然专有模型提供分层选项,但开源模型允许更深入的定制和所有权。然而,商业用途必须严格遵守法律许可要求,例如Apache-2.0或MIT,并且模型大小应与同类闭源模型的能力层级相对应。
-
Together AI推出MiniMax Speech 2.8 Turbo,用于自然语音代理
Together AI发布了MiniMax Speech 2.8 Turbo,这是一款专为自然语音代理设计的企业级文本转语音模型。新模型在韵律方面有显著改进,包含用于笑声和叹息等发声提示的声音标签,并拥有高保真语音克隆能力。它还能在250毫秒内完成端到端生成,现已在Together AI的专用基础设施上提供,同时还有超过600种新声音。
-
Together AI 引入 Rime 语音模型,实现富有表现力、可控的 AI 对话
Together AI 已将其企业级语音模型 Arcana v2 和 Mist v2 集成到其平台中。Arcana v2 提供基于真实客户互动训练的富有表现力的对话语音,而 Mist v2 则为大批量应用提供确定性的发音控制。这些模型旨在通过确保一致的发音和更像人类的对话流程,提高 AI 语音代理的可靠性和自然度,从而降低延迟并增强客户信任。
-
Together AI 副总裁:AI 未触及硬件瓶颈,效率提升空间巨大
Together AI 的 Kernels 副总裁 Dan Fu 认为,对通用人工智能(AGI)的追求并未触及硬件瓶颈。他提出,目前的 AI 系统严重低估了现有硬件的利用率,训练运行的平均浮点运算利用率(MFU)通常仅为 20%,而推理的利用率更是个位数。Fu 建议,通过软硬件协同设计以及 FP4 训练等创新,可以实现显著的性能提升,并且下一代硬件的未来计算能力尚未完全整合。
-
NVIDIA Nemotron Diffusion模型提供6.4倍更快的AI推理速度
NVIDIA发布了Nemotron-Labs Diffusion系列语言模型,提供3B、8B和14B参数规模。这些模型在一个架构内独特地支持自回归(AR)、扩散和自推测解码模式,实现了显著的速度提升。通过并行生成token块而非顺序生成,Nemotron-Labs Diffusion的吞吐量比传统AR模型高出6.4倍,同时保持或提高了准确性。这一突破解决了AR模型固有的内存带宽瓶颈,使其在生产部署和代理系统中更高效。
-
Together AI 发布新的 Python SDK v2.0 RC
Together AI 发布了其新的 Python SDK 2.0 版本的候选发布版。此更新的 SDK 使用 OpenAPI 规范和 Stainless 构建,采用现代、类型安全的架构,旨在提高性能和简化维护。它取代了旧的 v1 SDK,并引入了 Instant Clusters beta API 等新功能,同时为开发人员提供更好的类型安全和编辑器支持。
-
Together AI 推出 AutoJudge 以加快 LLM 推理速度
Together AI 的研究人员开发了 AutoJudge,这是一种加速大型语言模型推理的新颖方法。该技术可自动精选特定任务的数据集,从而无需手动注释即可实现有损推测解码。AutoJudge 可识别影响下游质量的关键标记,在标准推测解码的基础上实现了高达 2 倍的速度提升,同时准确性损失极小。
-
Together AI Cloud 通过 TorchForge 和工具集成增强 RL 管道
Together AI 正在增强其云平台以支持高级强化学习 (RL) 管道,集成 TorchForge 和 Monarch 进行分布式训练。该平台现在提供低延迟 GPU 通信和异构调度,用于混合 CPU/GPU 工作负载,这对于复杂的 RL 任务至关重要。与 Together CodeSandbox 和 Code Interpreter 的新集成允许 RL 代理与工具交互并执行代码,从而将它们的能力扩展到传统的游戏场景之外。
-
Together AI推出统一的实时语音代理平台
Together AI推出了一个统一的平台,用于构建实时语音代理,将语音转文本(STT)、大型语言模型(LLM)和文本转语音(TTS)集成在单一云环境中。这种同地部署旨在将延迟降低到500毫秒以下,并通过消除跨供应商的网络跳转来简化部署。该平台现在原生支持Deepgram的STT和Cartesia Sonic-3的TTS等模型,为开发人员提供了更多选择和更简化的生产就绪语音应用体验。
-
新研究探讨LLM的推理、指令遵循和自我纠正能力
几篇最新的研究论文探讨了大型推理模型(LRM)的内部机制和推理能力。其中一篇已被撤回的论文提出了熵梯度反演(Entropy-Gradient Inversion)及其相关优化技术(CorR-PO),通过关联词元熵与logit梯度来改进推理。另一篇被撤回的论文LambdaPO,旨在通过重新构想优势估计以获得更细粒度的偏好信号,从而增强强化学习的对齐。第三篇论文引入了凸组合能量最小化(Convex Compositional Energy…
-
Together AI 推出 40 多个图像和视频模型,包括 FLUX.2
Together AI 已扩展其平台以包含先进的多媒体生成功能,集成了 40 多个新的图像和视频模型。此举旨在通过提供统一的文本、图像和视频生成 API 来简化开发,消除开发人员管理多个提供商的需要。该平台现在托管 FLUX.2 等模型,用于一致的角色和产品图像生成,以及来自 OpenAI、Google 和 ByteDance 等主要参与者的视频模型。
-
Together AI 推出面向 AI 原生应用初创公司的加速器
Together AI 推出了一个专为构建 AI 原生应用程序的公司设计的新初创公司加速器计划。该加速器将为入选的初创公司提供平台积分、工程专业知识、上市支持以及风险投资网络。该计划旨在帮助这些初创公司在 Together AI 的平台上有效扩展其 AI 原生应用。早期参与者包括 Corridor.dev 和 PlayerZero,他们已在利用该计划的资源。
-
Together AI 聘请 Mahadev Konar 领导 GPU 基础设施
Together AI 任命 Mahadev Konar 为其新的基础设施工程高级副总裁,以加强其 GPU 云服务。Konar 是 Apache Hadoop 开发的关键人物,曾任 Instacart 的基础设施副总裁,他将领导提升 Together AI 平台可靠性、性能和可扩展性的工作。该公司旨在为 AI 原生初创公司提供强大的基础设施,使他们能够专注于产品开发,而不是管理复杂的 GPU 环境。
-
Together AI 提升自定义模型推理速度,优化开源大模型
Together AI 推出了名为 Dedicated Container Inference 的新服务,旨在优化自定义生成媒体模型的部署和性能。该平台处理自动扩展、排队和流量隔离等复杂的编排任务,使团队能够专注于其模型逻辑。该服务已显著加快了推理速度,部分客户的性能提升高达 2.6 倍。此外,Together AI 还宣布了其推理平台的进步,通过利用下一代 GPU 硬件和优化的内核,实现了顶级开源模型高达 2 倍的服务器无服务器推理速度。
-
Together AI 推出 LLM 评估工具,配备开源裁判
Together AI 推出了 Together Evaluations,这是一个新平台,旨在帮助开发人员针对特定任务对大型语言模型进行基准测试。该服务允许用户定义自定义基准测试,并利用领先的开源 LLM 作为裁判来评估模型响应质量。这种方法旨在提供比手动标记或僵化的自动化指标更快、更灵活的替代方案,目前已提供早期预览。
-
Together AI 集成 Deepgram 语音模型,推出快速 Whisper STT
Together AI 推出了新的语音转文本 (STT) 和文本转语音 (TTS) 功能,集成了 Deepgram 的先进语音模型及其高性能 Whisper V3 API。此举旨在通过提供一个统一的平台来实现实时语音代理的开发,该平台涵盖转录、LLM 处理和合成。这些产品强调速度、准确性和企业级功能,如零数据保留和大型文件处理,解决了当前语音 AI 应用中的关键延迟和质量问题。
-
Together AI 为安全 AI 工作负载达成 SOC 2 Type 2 合规
Together AI 已达成 SOC 2 Type 2 合规,彰显了其对安全和数据保护的坚定承诺。这一严谨的流程包括对其基础设施进行独立审计,验证了访问管理、数据加密和事件响应等方面的控制措施。该合规性尤其有利于医疗保健和生命科学组织,使其能够在遵守 HIPAA 要求的同时,使用 Together AI 的平台进行敏感数据分析和应用。