Gemma 4
PulseAugur coverage of Gemma 4 — every cluster mentioning Gemma 4 across labs, papers, and developer communities, ranked by signal.
- 2026-05-23 research_milestone Gemma 4 model achieves a 37.5% score on competition mathematics. 来源
- 2026-05-22 product_launch Google updated the Gemma 4 model to include simplified tool-calling capabilities for AI agent development. 来源
- 2026-04-04 product_launch Google released the Gemma 4 family of models, now integrated with Unsloth for optimized performance. 来源
9 天有情绪数据
-
NVIDIA GPU和AI加速早期宇宙星系的天文发现
天文学家正在利用NVIDIA的AI基础设施和GPU来分析詹姆斯·韦伯太空望远镜的海量数据集,从而能够更快地对早期宇宙星系进行分类和理解。一个关键工具是Morpheus AI系统,该系统改编自自动驾驶汽车技术,通过检查单个像素来区分星系组成部分。这种计算方法得到了拨款和NVIDIA DGX Station等系统的支持,对于处理原本需要数年才能分析的TB级数据至关重要。
-
Google DeepMind 推出 Gemini Enterprise Agent Platform 并扩展 Model Garden 访问权限
Google DeepMind 宣布推出 Gemini Enterprise Agent Platform,这是 Vertex AI 的一项演进,专为企业创建、管理和优化 AI 智能体而设计。该平台提供对 200 多个领先 AI 模型的访问权限,包括 Google 的最新进展,如 Gemini 3.1 Pro、Gemini 3.1 Flash Image 和 Lyria 3,以及 Gemma 4 等开放模型。新平台旨在通过增强的集成、…
-
Google 的 Gemma 4 AI 模型现已支持 iPhone 离线运行
Google 的 Gemma 4 模型现已可在 iPhone 上直接运行,实现完全离线 AI 推理。这一发展标志着向设备端 AI 的转变,E2B 和 E4B 等较小版本针对移动效率进行了优化。Google AI Edge Gallery 应用促进了这一点,提供了一个无需云依赖即可进行图像识别和语音交互等功能实验的平台。
-
Unsloth 修复 Gemma 4 训练和量化错误
Unsloth 为 Gemma 4 模型发布了重要的修复补丁,解决了最初并非由 Unsloth 引起但影响训练和量化的问题。这些更新解决了诸如梯度累积期间的损失爆炸和较大模型变体出现的索引错误等问题,确保 Gemma 4 训练现在能在 Unsloth 框架内正常运行。此次发布还包括了比其他设置更快的训练速度和更低的 VRAM 使用量优化,以及增强了 Unsloth Studio 对各种模型类型和任务能力的更新。
-
Google 的 Gemma 4 模型下载量突破200万次,推动设备端人工智能普及
Gemma 4 在发布的第一周内下载量已超过200万次,显示出该开源模型的巨大吸引力。其快速普及尤其值得注意的是在本地和边缘部署方面,用户已成功在iPhone等消费级硬件上运行该模型。这种广泛的可访问性正开始挑战对付费聊天订阅和云端人工智能服务的依赖。Gemma 4 的成功也凸显了广泛的生态系统支持对于开源模型普及的重要性,包括来自不同基础设施提供商的支持。
-
Modal 引入 NVIDIA Blackwell GPU、Command Palette 和 Sandbox API
Modal 发布了多项产品更新,包括可用于推理和微调任务的 NVIDIA RTX Pro 6000 Blackwell GPU。该平台还引入了可通过键盘快捷键访问的新 Command Palette,以便在仪表板内更轻松地导航。此外,Modal 的 Sandbox Filesystem API 已进入测试阶段,可靠性得到提高,SDK 也已更新,增强了 CLI 日志获取和新的部署策略。
-
Google 的 Gemma 4 26B 模型可在 LM Studio 的新无头 CLI 上本地运行
Google 的 Gemma 4 模型系列,特别是 26B-A4B 变体,现在可以在 MacBooks 等消费级硬件上进行本地推理。这种混合专家模型在每次推理时仅激活其一部分参数,从而在需要显著更少的内存和计算能力的同时,实现与更大密集模型相当的质量。LM Studio 的最新更新 0.4.0 版本引入了无头 CLI,无需图形界面即可方便地在本地设置和使用 Gemma 4 及其他模型。
-
Google Gemma 4模型现已可在Unsloth上运行和训练
Google发布了Gemma 4,这是一套包含E2B、E4B、26B-A4B和31B的全新模型。这些模型现已兼容Unsloth,一个优化模型训练和推理的平台。Unsloth使用户能够在仅6GB内存的设备上运行较小的Gemma 4模型,使其在手机等设备上可用,而较大的模型则需要约18GB内存。此次更新还显著提高了工具调用(tool calling)的准确性和稳定性,减少了错误并增加了允许的调用次数。
-
Google DeepMind 发布 Gemma 4,迄今为止最强大的开放式人工智能模型
Google DeepMind 发布了 Gemma 4,这是一个新的系列,包含四种开源模型,参数量从 20 亿到 310 亿不等。这些模型专为高级推理和代理工作流而设计,其中 31B 版本在 Arena AI 排行榜上排名第三,性能优于其规模 20 倍的模型。较小的 Gemma 4 模型针对设备端使用和多模态能力进行了优化,支持视觉和音频处理,并具有扩展的上下文窗口。
-
Google 发布支持长上下文的开源 Gemma 4 多模态模型
Google DeepMind 发布了 Gemma 4,这是一个在新发布的、基于 Apache 2.0 许可的开源模型家族,标志着其开源 AI 产品的一次重大进步。这些模型专为推理和代理工作流而设计,并提供了针对本地和边缘部署优化的版本,包括文本、视觉和音频的原生多模态能力。早期基准测试表明其性能具有竞争力,其中 31B 模型在开源选项中排名靠前,并且 llama.cpp 和 Ollama 等平台已迅速提供了生态系统支持。
-
Hugging Face 发布 Gemma 4,一款强大的设备端多模态人工智能
Hugging Face 宣布发布 Gemma 4,这是一款专为设备端部署设计的新型多模态人工智能模型。该模型旨在将先进的智能能力直接带到用户设备上,有可能增强隐私并减少延迟。此次发布标志着朝着更易于访问和集成的人工智能体验迈出了重要一步。
-
NVIDIA通过新基础设施、合作伙伴关系和开放模型推动物理AI
NVIDIA通过一系列新模型、基础设施和合作,正在显著推进物理AI和代理AI。该公司推出了NVIDIA Cosmos 3和Isaac GR00T N1.7等新的前沿模型,以及Gemma 4等针对云端和边缘设备优化的开放模型。NVIDIA还在增强其AI工厂参考设计,并与Google Cloud和Adobe合作,将这些功能集成到生产环境中,专注于从机器人技术到创意内容生成等应用的效率、安全性和可扩展性。