PulseAugur
实时 02:51:07
实体 Qwen3-4B-Base

Qwen3-4B-Base

PulseAugur coverage of Qwen3-4B-Base — every cluster mentioning Qwen3-4B-Base across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
3
90 天内 3
发布 · 30天
0
90 天内 0
论文 · 30天
3
90 天内 3
层级分布 · 90 天
情绪 · 30 天

2 天有情绪数据

最近 · 第 1/1 页 · 共 3 条
  1. TOOL · CL_27010 ·

    Lorem Ipsum text boosts LLM math skills in new research

    Researchers have discovered that prepending random Lorem Ipsum text to prompts during reinforcement learning can significantly improve LLM performance on mathematical reasoning tasks. This technique, called LoPE (Lorem …

  2. TOOL · CL_27584 ·

    新的K-12知识图谱基准测试大型语言模型课程认知

    研究人员开发了K12-KGraph,一个新颖的知识图谱,旨在专门评估和训练K-12教育领域的大型语言模型(LLMs)。该图谱源自官方教材,捕捉了课程结构,包括先决条件和概念关系,超越了简单的事实回忆。为了支持这一点,他们创建了K12-Bench(一个包含23,640个问题的基准测试集)和K12-Train(一个微调数据集)。实验表明,当前的大型语言模型在课程认知方面存在困难,而K12-Train数据集在教育基准测试上显著提高了性能,且样本效率高。

  3. TOOL · CL_16250 ·

    主密钥假说:通过线性子空间对齐解锁跨模型能力迁移

    研究人员提出了主密钥假说(Master Key Hypothesis),认为模型能力存在于可迁移的潜在子空间中,这些子空间可以在不同模型规模之间对齐。他们开发了一个名为 UNLOCK 的框架,实现了像链式思考(Chain-of-Thought)推理等能力的无训练、无标签迁移。实验表明,在不同 Qwen 模型之间迁移推理能力时,准确率显著提高,甚至超过了更大规模的、经过后续训练的模型。