Deutsch(DE) Fine

Together AI 扩展 LLM 微调功能，增加更长上下文

作者 PulseAugur 编辑部 · [2 个来源] · 2026-02-06 00:00

Together AI 增强了其微调平台，以支持更广泛的大型语言模型，包括 DeepSeek、Qwen 和 Meta 的最新版本，以及 OpenAI 的 gpt-oss。该平台现在提供扩展的上下文长度，部分模型的上下文长度可达 131k token，且无需额外费用，从而便于处理长文档和复杂的代码编辑等任务。另外，Together AI 的研究人员使用最小、主题中立的提示来探索 LLM 的行为，以揭示模型固有的偏好，他们发现 GPT-OSS 偏爱编程和数学，Llama 倾向于文学，DeepSeek 经常产生宗教内容，而 Qwen 则倾向于多项选择题。 AI

影响 Together AI 的平台更新使开发人员能够使用扩展上下文对更广泛的大型模型进行微调，从而有可能降低成本并提高复杂任务的性能。

排序理由该集群详细介绍了来自一家 AI 公司的重要平台更新，包括扩展的模型支持和扩展上下文长度等新功能，以及一篇探索 LLM 行为的研究论文。

在 Together AI blog 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

Together AI blog TIER_1 Deutsch(DE) · 2026-05-22 22:07

精细

Together AI expands Fine-Tuning Platform: train 100B+ models, extend context lengths, integrate with Hugging Face Hub, and access new DPO options.
Together AI blog TIER_1 English(EN) · 2026-02-06 00:00

当你不告诉大型语言模型该想什么时，它们会怎么想？

What do language models generate when you don't tell them what to generate? New research reveals that LLM families have distinct 'knowledge priors'—GPT models default to code and math, Llama favors narratives, DeepSeek generates religious content, and Qwen outputs exam questions.

报道来源 [2]

精细

当你不告诉大型语言模型该想什么时，它们会怎么想？

相关实体

相关话题