English(EN) Double Preconditioning (DoPr): Optimization for Test-Time Performance, not Validation Loss

新的 DoPr 优化提升 AI 测试时性能

作者 PulseAugur 编辑部 · [2 个来源] · 2026-06-04 17:22

研究人员推出了一种名为双预处理 (DoPr) 的新优化技术，旨在提高深度学习模型在测试时反馈 (TTF) 场景下的性能。该方法结合了梯度和激活预处理，以减轻模型在推出自身预测时发生的误差累积。DoPr 在各种 TTF 设置下都显示出增强下游模型性能的潜力，即使验证损失没有持续改善，这也对模型评估提出了新的问题。 AI

影响引入了一种新颖的优化技术，可以提高 AI 模型在顺序预测任务中的可靠性。

排序理由该集群包含一篇详细介绍新研究方法的学术论文。

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

arXiv cs.LG TIER_1 English(EN) · Thomas T. Zhang, Alok Shah, Yifei Zhang, Vincent Zhang, Nikolai Matni, Max Simchowitz · 2026-06-05 04:00

双预训练（DoPr）：针对测试时性能的优化，而非验证损失

arXiv:2606.06418v1 Announce Type: new Abstract: Many modern applications of deep learning involve training a neural network via a one-step prediction loss (e.g., $L^2$ regression, cross-entropy), but deploy the network by rolling out along its own predictions. Key examples includ…
arXiv cs.AI TIER_1 English(EN) · Max Simchowitz · 2026-06-04 17:22

双预训练 (DoPr)：针对测试时性能的优化，而非验证损失

Many modern applications of deep learning involve training a neural network via a one-step prediction loss (e.g., $L^2$ regression, cross-entropy), but deploy the network by rolling out along its own predictions. Key examples include autoregressive language modeling, flow-based g…

报道来源 [2]

双预训练（DoPr）：针对测试时性能的优化，而非验证损失

双预训练 (DoPr)：针对测试时性能的优化，而非验证损失

相关实体

相关话题