Together AI 增强了其微调平台,以支持更广泛的大型语言模型,包括 DeepSeek、Qwen 和 Meta 的最新版本,以及 OpenAI 的 gpt-oss。该平台现在提供扩展的上下文长度,部分模型的上下文长度可达 131k token,且无需额外费用,从而便于处理长文档和复杂的代码编辑等任务。另外,Together AI 的研究人员使用最小、主题中立的提示来探索 LLM 的行为,以揭示模型固有的偏好,他们发现 GPT-OSS 偏爱编程和数学,Llama 倾向于文学,DeepSeek 经常产生宗教内容,而 Qwen 则倾向于多项选择题。 AI
影响 Together AI 的平台更新使开发人员能够使用扩展上下文对更广泛的大型模型进行微调,从而有可能降低成本并提高复杂任务的性能。
排序理由 该集群详细介绍了来自一家 AI 公司的重要平台更新,包括扩展的模型支持和扩展上下文长度等新功能,以及一篇探索 LLM 行为的研究论文。
- DeepSeek
- DeepSeek-R1
- Gemma 3-4B
- gpt-oss
- Llama 3.1-8B
- Llama 4 Maverick
- Meta
- OpenAI
- Qwen
- Qwen3-235B
- Together AI
- Llama
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →