PulseAugur
实时 15:22:41
English(EN) Learning What to Predict: Downstream-Guided Task Design for Continued Pretraining

V-pretraining 方法提升 AI 模型特定任务性能

研究人员开发了一种名为 V-pretraining 的新方法,以提高 AI 模型持续预训练的有效性。该技术使用一小组下游示例来提供步级反馈,指导模型的学习过程,而无需直接用标签进行监督。V-pretraining 已在语言和视觉模态的特定目标能力方面取得了改进,尤其是在 Qwen 模型上,GSM8K 基准测试取得了显著的提升。 AI

影响 引入了一种在预训练期间提高 AI 模型目标能力而不损害通用性能的方法。

排序理由 该集群描述了一篇关于新颖 AI 模型预训练方法的最新研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Shuqi Ke, Giulia Fanti ·

    Learning What to Predict: Downstream-Guided Task Design for Continued Pretraining

    arXiv:2601.22108v2 Announce Type: replace-cross Abstract: Continued pretraining is optimized with fixed self-supervised tasks but selected by downstream performance, creating a coarse feedback loop in which practitioners evaluate checkpoints, change data mixtures or objectives, a…