研究人员推出了一种新颖的框架MIRA,用于在大型语言模型(LLM)的中期训练阶段进行源感知数据选择。该方法通过将评分标准发现直接整合到选择过程中,解决了从不同来源整理数据的挑战。MIRA识别每个数据源组的相关评估标准,然后利用这些标准训练可扩展的评分模型,从而能够高效地过滤大型数据集。实验表明,MIRA在代码相关基准测试中有效提高了性能,同时显著减少了所需的数据量。 AI
影响 MIRA的方法通过在关键的中期训练阶段优化数据选择,有望实现更高效、更有效的LLM训练。
排序理由 该集群包含一篇详细介绍LLM训练新方法的学术论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →