PulseAugur
实时 14:00:44

新方法融合Mixup和LLM,实现可解释的文本增强

研究人员开发了inversedMixup,一种新颖的自然语言处理数据增强技术,它结合了传统Mixup的可控性与LLM生成文本的可解释性。该方法将混合嵌入重构为人类可读的句子,从而深入了解文本Mixup中的流形入侵现象。实验表明,inversedMixup在少样本和全监督学习场景中都有效。 AI

影响 通过可解释的数据增强引入了一种提高NLP模型性能的新技术。

排序理由 这是一篇详细介绍NLP中数据增强新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.CL TIER_1 English(EN) · Fanshuang Kong, Richong Zhang, Qiyu Sun, Zhijie Nie, Ting Deng, Chunming Hu ·

    inversedMixup: Data Augmentation via Inverting Mixed Embeddings

    arXiv:2601.21543v3 Announce Type: replace Abstract: Mixup generates augmented samples by linearly interpolating inputs and labels with a controllable ratio. However, since it operates at the latent embedding level, the resulting samples are not human-interpretable. In contrast, L…