实体
AIME26
AIME26
PulseAugur coverage of AIME26 — every cluster mentioning AIME26 across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天
2 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
VibeThinker-3B:小型AI模型在推理方面取得重大突破
一款名为 VibeThinker-3B 的新型30亿参数AI模型展示了先进的推理能力,在具有挑战性的数学和编码基准测试中表现优于更大、更成熟的模型。具体而言,VibeThinker-3B 在 AIME26 数学测试和 LeetCode 编程挑战中取得了优异的成绩。这一发展表明,AI 中高效的推理可能并不完全依赖于庞大的参数数量。
-
新的 3B 模型 VibeThinker 在数学和编码方面达到前沿性能
研究人员开发了 VibeThinker-3B,这是一个拥有 30 亿参数的小型模型,在数学和编码任务上的表现可与更大模型相媲美。该模型基于 Qwen2.5-Coder-3B 构建,并采用了 Spectrum-to-Signal 训练流程,在 AIME26 和 LiveCodeBench 等基准测试中取得了优异成绩。开发者强调,参数密集的小型模型可以提供前沿的推理能力,是对传统扩展定律的补充,但他们也承认在更广泛的通用应用方面存在局限性。