Google 发布了 Gemini 3.5 Flash,这是一款针对 Agentic Coding 任务和工具编排优化的新型 Flash 级别模型。该模型旨在比之前的 Pro 级别模型在特定 Agent 循环中更具成本效益,在 MCP Atlas 等 Agentic 基准测试中表现优于 Gemini 3.1 Pro。然而,与前代模型相比,它在长上下文检索和抽象推理方面有所退步,并且尽管每 token 定价较低,但其每任务成本可能高于预期。此外,建议使用一个更轻量级的版本 Gemini 2.5 Flash-Lite 作为 RAG 和 Agent 系统中的路由层,以智能地将任务导向合适的模型或人工审核,从而优化成本和可靠性。 AI
影响 该模型以 Agent 为先的设计和针对特定任务的成本效益,可能会加速复杂 AI Agent 系统的采用。
排序理由 来自前沿实验室(Google DeepMind)的新模型发布。
- Antigravity harness
- Claude Code
- Claude Opus 4.7
- Gemini 2.5 Flash-Lite
- Gemini 3.1 Pro
- Gemini 3.5 Flash
- GitHub Copilot
- Google DeepMind
- MCP Atlas
- OpenRouter
- SWE-Bench Verified
AI 生成摘要 · Google Gemini · 来自 3 个来源。 我们如何撰写摘要 →