研究人员开发了一种新颖的方法,通过将研究提案评估和生成问题化为科学预测问题来使用语言模型进行处理。他们创建了一个包含21,835篇论文的数据集,并引入了未来对齐分数(FAS)来衡量提案在多大程度上预测了未来的研究方向。使用Llama-3.1和Qwen2.5等模型进行此方法的微调,未来对齐度提高了10.6%,人类评估证实了提案质量的提高。生成的提案也显示出实际影响,在MATH数据集上提高了准确性,并在模型合并技术方面有所改进。 AI
排序理由 该集群包含一篇学术论文,详细介绍了评估AI生成的研究提案的新方法和数据集。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →