清华大学的研究人员开发了一个名为UDS的新型在线样本选择框架,该框架已在ICML 2026上发表。该方法通过智能过滤冗余或低质量的训练数据,显著减少了大型语言模型监督微调所需的计算资源。通过分析模型的正向传播logits,UDS评估样本的重要性和多样性,在不影响模型准确性的前提下,计算能力最高可降低50%。这项创新有望降低定制模型微调的门槛,尤其对小型人工智能公司和专业应用而言。 AI
影响 降低大语言模型微调的算力成本,可能加速各行业的定制模型开发和部署。
排序理由 该集群描述了一个在主要学术会议上提出的新研究框架,重点关注大语言模型训练的算法改进。[lever_c_demoted from research: ic=1 ai=1.0]
- FisherSFT
- IDC
- large language models
- Llama-3.1:8b
- LoRA
- Qwen 2.5 7B
- supervised fine-tuning
- Tsinghua University
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →