Gemma 4
PulseAugur coverage of Gemma 4 — every cluster mentioning Gemma 4 across labs, papers, and developer communities, ranked by signal.
- 2026-05-23 research_milestone Gemma 4 model achieves a 37.5% score on competition mathematics. 来源
- 2026-05-22 product_launch Google updated the Gemma 4 model to include simplified tool-calling capabilities for AI agent development. 来源
- 2026-04-04 product_launch Google released the Gemma 4 family of models, now integrated with Unsloth for optimized performance. 来源
9 天有情绪数据
-
Gemma 4的26B MoE模型在16GB GPU上提供接近30B的质量
一份指南详细介绍了运行Google的Gemma 4模型的最佳GPU硬件,重点介绍了26B-A4B混合专家(MoE)变体。该MoE模型提供接近30B的质量,同时能容纳在16GB显存中,使其在RTX 4060 Ti或RTX 5070 Ti等中端GPU上可用。该指南将其与需要RTX 4090等高端显卡的大型31B密集模型进行了对比,并为每个Gemma 4变体提供了具体的显存要求和性能基准。
-
出版商就 AI 版权起诉 Meta;WiseTech 裁员 2000 人;Google 加速 Gemma 4
包括 McGraw-Hill、Macmillan 和 Cengage 在内的主要出版商已对 Meta 提起集体诉讼,指控该公司使用数百万本受版权保护的书籍来训练其 Llama AI 模型。此外,Google 宣布在其 Gemma 4 模型系列中取得了文本生成效率的突破,通过多令牌预测实现了高达三倍的输出速度。在另一项发展中,WiseTech Global 据报道将裁员 2000 人,其股价大幅下跌,同时也在讨论 AI 对物流软件行业的影响。
-
Google 优化 Gemma 4 以适应移动设备,提高速度并减少内存使用
Google 开发了新的助手模型,显著提高了 Gemma 4 在移动设备上的性能。这些模型使 Gemma 4 的运行速度提高高达三倍,同时占用的内存大大减少。这一进步使得 AI 处理可以直接在智能手机上更高效地进行。
-
AI 进展:Gemma 4 速度测试、MTPLX 编码代理、Meta 机器人、Perplexity 金融工具
Perplexity 推出了专为金融分析师设计的 AI 工具,整合了 Morningstar 和 PitchBook 等高级数据源。此外,一种名为 AINA 的新型机器人 AI 方法利用 Meta 的 Aria Gen 2 眼镜,无需模拟即可学习和应用多指机器人策略。另外,MTPLX 已解决内存问题,可以对其编码代理进行测试,并且有人讨论测试 Gemma 4 以获得潜在的性能提升。
-
OpenAI 发布 GPT-5.5 Instant,Subquadratic 推出 12M 上下文,Meta 计划代理式 AI
OpenAI 推出了 GPT-5.5 Instant,这是其默认 ChatGPT 模型的更新,侧重于提高事实准确性和减少幻觉。同时,Subquadratic 推出了一个拥有 1200 万 token 上下文窗口的新 AI 模型,据报道在检索基准测试中优于 GPT-5.5,并计划很快实现 5000 万 token 的窗口。Meta 也在开发由其 Muse Spark 模型驱动的个性化 AI 助手,旨在执行日常任务并减少人工干预进行学习,…
-
Ollama v0.23.1 为 Mac 添加 Gemma 4 MTP 以加快编码速度
Ollama 发布了 0.23.1 版本,在 Mac 上引入了对 Gemma 4 MTP(多令牌处理)和投机解码的支持。据报道,这项增强功能可以将 Gemma 4 31B 模型在执行编码任务时的速度提高一倍。此次更新还包括对 MLX 和 MLX-C 的线程修复。
-
Google的Gemma 4增加了MTP以加快本地推理速度,VibeVoice已移植到C++,Ollama获得桌面层
Google发布了Gemma 4,其中包含多令牌预测(MTP)功能,该功能允许模型同时预测多个令牌,从而显著加快本地推理速度。此外,使用ggml库开发了Microsoft VibeVoice模型的C++端口vibevoice.cpp,无需Python即可在消费级硬件上实现先进的语音到文本和文本到语音功能。还有一个独立项目正在进行中,旨在为Ollama创建一个离线的、低内存占用的桌面应用程序,以简化对技术水平较低用户的本地LLM部署。
-
Google 推出更快的 Gemma 4 并扩大 Kaggle 基准赠款
Google 宣布其 Gemma 4 模型现已运行速度提高三倍,这得益于引入了 MTP drafters。此项增强功能使模型能够同时预测和输出多个 token,在保持输出质量和智能的同时显著提高了推理速度。此次更新侧重于改进模型推理性能。
-
.NET Aspire 可视化工具现支持通过 Ollama 的本地 LLM,如 Gemma 4
本文详细介绍了如何将本地 LLM,特别是通过 Ollama 的 Gemma 4 模型,集成到 .NET Aspire GenAI 可视化工具中。这种设置允许开发人员直接在 Aspire 仪表板中检查 LLM 对话,包括提示、响应和 token 使用情况,而无需依赖 Azure 服务。该集成利用了 OpenTelemetry GenAI 语义约定,使其能够与任何 OpenAI 兼容的后端兼容,从而为本地 AI 开发带来增强的数据隐私、可…
-
Needle模型提炼Gemini,用于精确的工具调用任务
一个名为Needle的、拥有2600万参数的新模型已被开发出来,它从Google的Gemini提炼而来,专门擅长工具调用任务。其核心创新不在于模型大小,而在于它能够可靠地生成结构化输出(如JSON),解决了大型语言模型驱动系统中的一个关键瓶颈。该专用模型旨在超越大型通用模型在需要精确遵循函数模式的任务中的表现,并有可能集成到Ollama等工具中。
-
Google's Gemma 4 models achieve 3x speed boost with speculative decoding
Google 为其 Gemma 4 开源模型发布了多令牌预测 (MTP) 草稿器,可将推理速度提高高达三倍。这项进展利用了投机解码架构,允许一个轻量级的草稿器模型同时预测多个令牌,而主模型则对其进行验证。MTP 草稿器的目标是解决标准 LLM 推理中的内存带宽瓶颈,在不影响输出质量或推理准确性的情况下提供更快的性能。
-
新的 LoRA 构建器使用 Gemma 4 自动化动漫 AI 模型训练
一款名为“全能 LoRA 构建器 2026”(All-in-One LoRA Builder 2026)的新工具已发布,旨在简化使用 Stable Diffusion 训练动漫风格 AI 模型的过程。该构建器可自动化角色提取和标记等关键流程,显著减少用户的手动工作量。它利用 Google 的 Gemma 4 模型进行智能字幕生成,使整个工作流程更加高效。
-
Gradio、IBM/UC Berkeley 和 Google Gemma 4 更新
Gradio 的 gr.HTML 功能允许一步创建 Web 应用程序。IBM 和 UC Berkeley 合作开发了 IT-Bench 和 MAST,这些工具旨在诊断企业 AI 代理中的问题。Google 推出了 Gemma 4,这是一款针对设备性能优化新的多模态 AI 模型。
-
Google 的 Gemma 4 模型下载量达 5000 万次,社区模型数量达 1500 个
自几周前发布以来,Google 的 Gemma 4 模型获得了显著的采用,下载量已超过 5000 万次。该模型还激发了庞大的开发者社区,在其基础上构建了近 1500 个自定义模型。这种快速的普及表明 Gemma 4 在开发者社区中引起了强烈的兴趣和活跃度。
-
🚀 Ollama 新模型发布!🚀 模型:nemotron3 🔗 https://ollama.com/library/nemotron3 # Ollama # AI # LLM # mcpo
Ollama 发布了 v0.22.1 版本,其中包括 Gemma 4 渲染器的更新,以改进思考和工具调用能力。此版本还确保模型推荐无需完全更新 Ollama 即可更新,并将桌面应用程序的启动页面与“ollama launch”集成保持一致。此外,之前的版本还引入了 Mistral Medium 3.5、NVIDIA 的 Nemotron 3 Omni 以及 Poolside 的 Laguna XS.2 编码模型等新模型。
-
基于Bash的AI编码助手使用本地Gemma模型,性能超越Copilot
一位开发者创建了一个命令行编码助手,结合了bash、sed和grep等标准的Linux工具以及curl。这个名为“canitbedone”的项目利用Google的Gemma 4模型的一个本地实例,通过llama.cpp运行其AI功能。开发者报告称,该工具表现出人意料地好,在某些任务上甚至超越了GitHub Copilot,并且除了核心Linux实用程序和AI模型之外,依赖性极小。
-
Omar Sanseviero 重点介绍 Gemmaverse,展示开放模型应用和开发者演示
Omar Sanseviero 介绍了 Gemma 4,并向亚太地区的创作者和媒体强调了开放模型的潜力。他展示了 Gemmaverse 中的开发者演示和用例,并强调了当前 AI 开发的有利时机。此次演示强调了基于开放模型构建的生态系统和应用的扩展,并对未来社区驱动的创新表示期待。
-
Google 的 Gemma 4 AI 模型展示了超越文本分析的多模态能力
Google 已经测试了其多模态 AI 模型 Gemma 4,该模型展示了超越文本处理的能力。该模型可以分析图像、理解音频,甚至能总结长达 50 分钟的广播剧等冗长音频内容。提供了一个视频演示来展示其功能和局限性。
-
本地AI代理在Chrome中运行,使用Gemma 4和WebGPU
已开发出一种新的AI代理,可在Chrome浏览器内本地运行,无需单独的服务器。该代理利用Google的Gemma 4模型和WebGPU技术进行操作。该开发旨在直接为用户提供AI功能,而无需复杂的基础设施。
-
Fireworks AI 将 Google 的 Gemma 4 模型添加到其训练平台
Fireworks AI 宣布已将其训练平台整合了 Google DeepMind 的 Gemma 4 模型,特别是 26B 和 31B 参数版本。此次整合允许用户利用 Fireworks 的托管和训练 API 工作流对这些模型进行微调。该平台支持监督微调 (SFT) 和直接偏好优化 (DPO),并提供可自定义的损失函数和 256K 上下文窗口,预计很快将支持强化学习 (RL)。