实体
Qwen3–30B-A3B-Thinking-2507
Qwen3–30B-A3B-Thinking-2507
PulseAugur coverage of Qwen3–30B-A3B-Thinking-2507 — every cluster mentioning Qwen3–30B-A3B-Thinking-2507 across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
0
90 天内 0
层级分布 · 90 天
主题
情绪 · 30 天
2 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
NVIDIA Nemotron 3 Nano:用于高效 AI 代理的开放模型
NVIDIA 发布了 Nemotron 3 Nano,这是一个拥有 300 亿参数的开放模型,专为高效推理和长上下文应用而设计。该模型采用了混合专家混合(Mixture-of-Experts)架构,每个 token 只激活其参数的一小部分,从而降低了强大推理性能的运营成本。Nemotron 3 Nano 在推理、编码和代理工作流基准测试中表现出竞争力,使其适用于构建需要处理大型文档或复杂任务的 AI 代理、编码助手和 RAG 系统的开发者。
-
NVIDIA 发布高效 Nemotron 3 LLM 系列,采用混合架构
NVIDIA 发布了两款新的大型语言模型 Nemotron 3 Nano 和 Nemotron 3 Ultra,专注于效率和高级功能。Nemotron 3 Nano 是一款 30B 级模型,专为私有推理和代理工作流设计,采用混合 Mamba-Transformer Mixture-of-Experts 架构,并支持高达 100 万个 token 以实现长上下文应用。Nemotron 3 Ultra 是一款 550B 参数模型,采用类似…