实体
Qwen 3 14B
Qwen 3 14B
PulseAugur coverage of Qwen 3 14B — every cluster mentioning Qwen 3 14B across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天
1 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
Qwen 3 14B模型在400美元GPU上高效运行,性能强劲
Qwen 3 14B模型提供了出色的性能成本比,取得了81.1的MMLU分数,并在配备16GB显存的400美元RTX 4060 Ti GPU上有效运行。该配置支持高达16K上下文窗口的流畅交互式推理。更大的Qwen 3模型,如32B和72B版本,需要显著更多的显存,因此需要RTX 4090等高端消费级显卡或多GPU配置。
-
新框架GoalCover帮助检测LLM微调数据中的能力差距
研究人员推出了一种名为GoalCover的新框架,用于识别用于微调大型语言模型的数据集中的不足之处。该系统引导用户将高级目标分解为更小的子目标,然后根据这些子目标对训练样本进行评分。这个过程有助于在昂贵的微调开始之前找出缺失的能力,实验表明,当数据损坏时,目标能力会显著下降,这也证明了该框架的有效性。