NVIDIA发布了Nemotron 3.5 Content Safety,一个支持可定制策略和全球合规的企业级多模态安全模型。ServiceNow-AI推出了EVA-Bench Data 2.0,一个扩展的AI代理评估基准,涵盖工具使用、推理和错误恢复。JetBrains推出了Mellum2,一个为软件开发任务优化的12B参数MoE模型,而Dharma-AI发布了将Direct Preference Optimization从聊天机器人扩展到代码生成和创意写作等领域的研究。 AI
影响 新模型和基准的发布,推动了AI安全、代理能力和软件开发工具的进步。
排序理由 该集群包含来自不同组织的多个研究论文和模型发布。[lever_c_demoted from research: ic=1 ai=1.0]
- Dharma-AI
- Direct Preference Optimization
- EVA-Bench Data 2.0
- Hcompany
- Holo3.1
- JetBrains
- Mellum2
- Nemotron 3.5 Content Safety
- NVIDIA
- ServiceNow-AI
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →