Together AI
PulseAugur coverage of Together AI — every cluster mentioning Together AI across labs, papers, and developer communities, ranked by signal.
- uses Nvidia Blackwell B200 90%
- founded Vipul Ved Prakash 90%
- developed Together Code Interpreter 90%
- developed Gemma-4-31B-it-Pearl 90%
- uses Deepgram 90%
- partners with Pearl Research Labs 90%
- used by DeepSeek-R1 70%
- affiliated with Nvidia Blackwell B200 70%
- instance of Qwen 70%
- used by Together Code Interpreter 70%
- used by Zoom 70%
- uses RiMe. Rivista dell'Istituto di Storia dell'Europa Mediterranea 70%
- 2026-05-22 product_launch Together AI launched updates to its Fine-Tuning Platform, adding support for new LLMs and extending context lengths. 来源
- 2026-05-22 product_launch Together AI announced the addition of 1,000 NVIDIA H100 and H200 GPUs to its infrastructure. 来源
- 2026-05-22 product_launch Together AI launches GPU clusters with NVIDIA Blackwell platform and optimized kernel collection, achieving significant performance gains. 来源
- 2026-05-22 product_launch Together AI released FlashAttention-3 and FlashAttention-4, optimized attention mechanisms for GPUs. 来源
- 2026-05-22 product_launch Together AI launched major upgrades to its Batch Inference API. 来源
- 2026-05-22 product_launch Together AI launched access to the Qwen3.7-Max model. 来源
- 2026-05-15 partnership Together AI and Pearl Research Labs formed a partnership to integrate blockchain for AI inference cost reduction. 来源
- 2026-05-14 research_milestone Together AI's speech-to-text models achieved top rankings for transcription speed on a benchmark leaderboard. 来源
- 2026-05-08 product_launch Together AI launched a new feature enabling deployment of any Hugging Face model via their Dedicated Container Inference infrastructure using the Goose CLI agent. 来源
- 2026-04-30 research_milestone Together AI details its rapid response and mitigation strategy for the Copy Fail Linux kernel vulnerability. 来源
- 2026-04-30 partnership Together AI announced a partnership with Adaption to integrate their data optimization and model fine-tuning services. 来源
- 2026-03-26 research_milestone Together AI researchers published a framework for using smaller LLMs on long context tasks. 来源
- 2026-03-18 product_launch Together AI launched an enhanced fine-tuning service with support for tool calls, reasoning, and vision-language models. 来源
- 2026-03-16 product_launch Together AI announced new integrations and product offerings at NVIDIA GTC 2026.
- 2026-03-10 product_launch Together AI introduced significant enhancements to its GPU clusters, including multi-tenancy, autoscaling, observability, and self-healing features. 来源
11 天有情绪数据
Together AI to announce enterprise-focused cloud offering within 90 days
The recent launch of self-service GPU clusters and the ATLAS inference system, combined with enhanced fine-tuning capabilities and a brand refresh emphasizing 'builders', suggests Together AI is positioning itself for a more robust enterprise offering. These services are foundational for enterprise AI development and deployment, indicating a strategic move towards capturing a larger market share.
Together AI's ATLAS system shows strong performance against specialized hardware
The reported performance of Together AI's ATLAS system, achieving up to 500 TPS on DeepSeek-V3.1 and outperforming specialized hardware like Groq, is a significant technical achievement. This suggests their adaptive inference approach is highly effective and could set a new benchmark for LLM inference speed and efficiency.
Together AI to integrate NVIDIA Blackwell features into all core services
The 90% training speed boost achieved with NVIDIA Blackwell and custom kernels indicates a deep integration. It's likely Together AI will leverage Blackwell's capabilities across their entire platform, including their new instant clusters and fine-tuning services, to offer a performance edge over competitors.
-
Together AI 通过 Hypertec 和 5C 在欧洲部署 100,000 个 GPU
Together AI 正通过与 Hypertec 和 5C Group 的合作,大力扩展其在欧洲的基础设施。该计划旨在提供高达 2 吉瓦的 AI 专用数据中心容量和近 100,000 个 NVIDIA GPU,初步部署将于 2025 年底开始,并持续到 2028 年。此次扩张侧重于提供主权、符合法规的 AI 基础设施,以支持前沿模型的训练和推理,满足欧洲对本地化 AI 能力日益增长的需求。
-
Together AI 倡导开源模型推动 AI 前沿发展
Together AI 认为 AI 发展的未来在于开源模型,挑战了专有实验室是唯一创新驱动者的观念。该公司强调,开源平台提供更大的灵活性和成本效益,这对于 AI 应用的广泛采用至关重要。他们指出,像 Llama 3、Deepseek R1 和 Qwen3 等开源模型的最新进展证明了 AI 的前沿正日益受到协作式、开放式开发的塑造。
-
Together AI发布YAQA以改进LLM量化
Together AI推出了一种新颖的大型语言模型后训练量化技术YAQA。该方法旨在通过直接最小化KL散度来比现有算法更有效地保留原始模型的输出。YAQA通过近似KL散度的Hessian来实现这一点,与当前的舍入方法相比,KL散度降低了30%以上,并在下游任务上提高了性能。
-
新的基准和模型推动AI图像编辑能力发展
研究人员推出了用于评估图像编辑模型的新基准和数据集,解决了当前系统的局限性。VINS-120K为超高分辨率图像编辑提供了大规模数据集,而VDE Bench则专注于修改包含多种语言密集文本的视觉文档。VIBE是另一个基准,用于评估模型遵循视觉指令的能力,结果显示专有模型目前优于开源替代品,但在复杂任务上仍有困难。此外,Together AI推出了FLUX.1 Kontext模型,该模型无需微调即可使用文本和图像提示进行上下文图像生成和编辑。
-
Together AI 发布 API 以执行 LLM 生成的代码
Together AI 推出了 Together Code Interpreter (TCI),这是一个旨在安全执行由大型语言模型生成的代码的 API。该工具解决了 LLM 无法运行其生成代码的局限性,使开发人员能够在代理工作流中集成和测试代码。TCI 创建沙盒环境来执行代码,并返回结果,这些结果可以反馈给 LLM 以进行迭代改进和更丰富的用户响应。该解释器还通过在模型训练期间自动化代码评估和单元测试,在加速强化学习操作方面显示出潜力。
-
Together AI 推出用于 AI 生成代码的代码执行工具
Together AI 推出了两款新产品 Together Code Sandbox 和 Together Code Interpreter,旨在改进 AI 生成代码的执行。Together Code Sandbox 提供可定制的虚拟机环境,用于构建开发工具和代理工作流,具有快速启动和扩展虚拟机的能力。Together Code Interpreter 在这些安全沙箱中提供基于会话的 Python 代码执行的简单 API,专为简单的用例设计。
-
Together AI 收购 Refuel.ai 以增强企业 AI 数据能力
Together AI 已收购专注于 AI 应用数据清理和结构化的公司 Refuel.ai。此次收购旨在将 Refuel.ai 的模型和平台整合到 Together AI 现有的 AI 加速云基础设施中,以增强其能力。结合后的能力旨在帮助企业克服数据挑战,并加速生产级 AI 应用的开发。
-
Arcee AI 迁移至 Together 端点以实现成本高效的 SLM
Arcee AI 已将其专业小型语言模型 (SLM) 从 AWS 迁移到 Together 专用端点,以寻求改进成本、性能和运营敏捷性。该公司专注于训练参数量在 720 亿以下的、用于编码和通用文本生成等特定任务的高效模型。Arcee AI 还开发了 Arcee Conductor,这是一个推理路由系统,可将查询定向到最合适的模型,包括 GPT-4.1 和 Claude 3.7 Sonnet 等第三方选项,以优化成本和性能。
-
Together AI 借助 NVIDIA Blackwell 将 AI 训练速度提升 90%
Together AI 推出了采用 NVIDIA Blackwell 平台的新 GPU 集群,显著加快了 AI 训练和推理速度。这些集群由 Together Kernel Collection 提供支持,与之前的 NVIDIA H100 硬件相比,训练速度最高可提高 90%,处理大型模型的速度超过每秒 15,000 个 token。Salesforce 和 Zoom 等早期客户已报告了显著的性能提升,其中一些客户的训练速度翻倍。Tog…
-
Together AI 发布持续 LLM 微调平台
Together AI 推出了新的微调平台,允许用户持续改进开放权重语言模型。该平台现已支持偏好优化和持续训练,使模型能够根据用户反馈和新数据进行调整。新的 Web UI 简化了该过程,允许开发人员直接从浏览器管理数据集、指定参数和监控实验。
-
Google AI推出LAVA优化云算力,Together AI扩展GPU云,Modal简化AI/ML部署
Google DeepMind的研究人员开发了LAVA,一种新的人工智能驱动的调度算法,旨在优化云数据中心的资源分配。LAVA持续重新预测虚拟机(VM)的生命周期,适应实际使用模式,而不是依赖初始估计。这种方法旨在通过更精确地将虚拟机打包到物理服务器上来减少浪费的容量并提高效率。该系统使用一种受生存分析启发的概率分布模型来处理虚拟机生命周期中的固有不确定性。
-
Hugging Face 的社交 AI
Hugging Face 宣布了一系列旨在增强 AI 模型的可访问性、安全性和可扩展性的合作伙伴关系和产品更新。与 Google、VirusTotal、JFrog、Wiz Research 和 Protect AI 的合作侧重于改善 ML 社区内的 AI 安全性和透明度。此外,与 Together AI 和 Dask 的新集成,以及 HUGS 的推出,旨在简化各种用例(包括复杂的生成式 AI 任务)的开源 AI 模型的微调和扩展。