发布了几个新的开源AI模型,包括用于多模态任务的Gemma 4 12B和用于图像生成且布局控制增强的Ideogram 4.0。此外,公司正在开发专用代理和工具,例如Harvey的法律代理,其成本更低但性能优于Opus 4.7;以及Microsoft Scout,一个用于Microsoft 365的代理。新的基准测试(如ViBench)也正在出现,用于评估代码生成能力,其中Opus 4.8在价格/性能方面表现强劲。 AI
影响 新的开源模型和专用代理加速了工具开发和基准测试竞争。
排序理由 该集群包含多个新的开源模型发布和基准测试,符合研究类别。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →