研究人员开发了 MIRAGE,一种通过增强元数据和评估 FAIR 原则来分析软件开发库挖掘 (MSR) 数据集的新方法。该方法使用 Semantic Scholar API 收集 2013 年至 2024 年的数据,并应用潜在狄利克雷分配 (LDA) 主题建模进行分析。研究发现,存储库托管网站和数据格式会影响引用模式和可用性,表明改进的注释可以提高数据集的可发现性和可重用性。 AI
影响 增强了研究成果的可发现性和可重用性,通过改善对软件工程数据的访问来可能加速 AI 的发展。
排序理由 这是一篇详细介绍数据集分析新方法的学术论文。[lever_c_demoted from research: ic=1 ai=0.7]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →