新方法融合Mixup和LLM，实现可解释的文本增强

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-10 04:00

研究人员开发了inversedMixup，一种新颖的自然语言处理数据增强技术，它结合了传统Mixup的可控性与LLM生成文本的可解释性。该方法将混合嵌入重构为人类可读的句子，从而深入了解文本Mixup中的流形入侵现象。实验表明，inversedMixup在少样本和全监督学习场景中都有效。 AI

影响通过可解释的数据增强引入了一种提高NLP模型性能的新技术。

排序理由这是一篇详细介绍NLP中数据增强新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Fanshuang Kong, Richong Zhang, Qiyu Sun, Zhijie Nie, Ting Deng, Chunming Hu · 2026-06-10 04:00

inversedMixup：通过反转混合嵌入进行数据增强

arXiv:2601.21543v3 Announce Type: replace Abstract: Mixup generates augmented samples by linearly interpolating inputs and labels with a controllable ratio. However, since it operates at the latent embedding level, the resulting samples are not human-interpretable. In contrast, L…