English(EN) Learning What to Predict: Downstream-Guided Task Design for Continued Pretraining

V-pretraining 方法提升 AI 模型特定任务性能

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-15 04:00

研究人员开发了一种名为 V-pretraining 的新方法，以提高 AI 模型持续预训练的有效性。该技术使用一小组下游示例来提供步级反馈，指导模型的学习过程，而无需直接用标签进行监督。V-pretraining 已在语言和视觉模态的特定目标能力方面取得了改进，尤其是在 Qwen 模型上，GSM8K 基准测试取得了显著的提升。 AI

影响引入了一种在预训练期间提高 AI 模型目标能力而不损害通用性能的方法。

排序理由该集群描述了一篇关于新颖 AI 模型预训练方法的最新研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Shuqi Ke, Giulia Fanti · 2026-06-15 04:00

Learning What to Predict: Downstream-Guided Task Design for Continued Pretraining

arXiv:2601.22108v2 Announce Type: replace-cross Abstract: Continued pretraining is optimized with fixed self-supervised tasks but selected by downstream performance, creating a coarse feedback loop in which practitioners evaluate checkpoints, change data mixtures or objectives, a…

报道来源 [1]

Learning What to Predict: Downstream-Guided Task Design for Continued Pretraining

相关实体

相关话题