English(EN) When Top-1 Fails: Calibrating LoRA Monitors for Masked Diffusion LMs

新研究质疑 Top-1 浓度作为扩散模型 LoRA 监控器的有效性

作者 PulseAugur 编辑部 · [2 个来源] · 2026-06-23 04:09

一篇新研究论文探讨了使用 LoRA（低秩适配）对离散扩散语言模型（DLM）进行微调的诊断工具的有效性。研究发现，常用的 top-1 argmax 浓度指标在检测训练崩溃方面并不可靠，因为它在训练早期就已饱和，并且对最终的训练稳定性不敏感。研究人员提出使用最大 LoRA 梯度范数作为更有效的参数端信号，以识别稳定的训练配置，在保留数据集上实现了 0.68 的精确率和 0.79 的 F1 分数。 AI

影响这项研究可能带来更可靠的扩散语言模型微调监控技术，提高训练稳定性和效率。

排序理由该集群包含一篇详细介绍机器学习新发现和方法的 ist 研究论文。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

arXiv cs.CL TIER_1 English(EN) · Lucky Verma, Pratik Yadav · 2026-06-24 04:00

When Top-1 Fails: Calibrating LoRA Monitors for Masked Diffusion LMs

arXiv:2606.24119v1 Announce Type: cross Abstract: Discrete diffusion language model (DLM) fine-tuning inherits inexpensive diagnostics from denoising-time confidence monitors, but their PEFT-training meaning is untested. We test top-1 argmax concentration as a collapse warning. A…
arXiv cs.CL TIER_1 English(EN) · Pratik Yadav · 2026-06-23 04:09

When Top-1 Fails: Calibrating LoRA Monitors for Masked Diffusion LMs

Discrete diffusion language model (DLM) fine-tuning inherits inexpensive diagnostics from denoising-time confidence monitors, but their PEFT-training meaning is untested. We test top-1 argmax concentration as a collapse warning. Across 816 LoRA/PEFT configurations from three DLM …

报道来源 [2]

When Top-1 Fails: Calibrating LoRA Monitors for Masked Diffusion LMs

When Top-1 Fails: Calibrating LoRA Monitors for Masked Diffusion LMs

相关实体

相关话题