PulseAugur
实时 06:23:51
English(EN) A-Evolve-Training: Autonomous Post-Training of a 30B Model

自主系统在无人干预的情况下对30B Nemotron模型进行训练后

研究人员开发了一个自主系统,能够在无人干预的情况下对一个拥有300亿参数的模型进行训练后。该系统成功地在数周内迭代训练了一个Nemotron模型,并在NVIDIA Nemotron-Reasoning Challenge上取得了有竞争力的分数。值得注意的是,该系统检测到了一个误导性的发展指标,并调整了其搜索策略以优先考虑外部性能,展示了超越单纯优化的发现能力。 AI

影响 展示了通过自主系统加速人工智能模型开发和发现的潜在途径。

排序理由 该条目报道了一篇详细介绍用于人工智能模型训练后自主系统的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

自主系统在无人干预的情况下对30B Nemotron模型进行训练后

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Zhan Shi, Bing He, Yisi Sang, Hanqing Lu, Benoit Dumoulin ·

    A-Evolve-Training:30B模型的自主训练后训练

    arXiv:2606.20657v2 Announce Type: replace Abstract: Post-training a frontier model is normally weeks of human work: proposing data and recipe changes, launching runs, reading evals, deciding what to keep. We report an autonomous system that runs this loop with no human in the loo…