研究人员引入了一个专注于代码和文本片段之间小粒度双向搜索的新任务,旨在直接将科学出版物与其对应的代码联系起来。他们为此任务开发了一个大型数据集,包括使用GPT-4自动生成的文本描述,并提出了一种带有共享编码器的模块化方法来处理子任务。该方法显示出有希望的结果,表明使用自动生成数据进行训练是可行的,尽管在域外性能方面还需要进一步的工作。 AI
影响 为连接科学文献与代码建立了一个新的基准,有可能提高研究的可复现性和理解。
排序理由 学术论文,介绍了一项新任务和数据集。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →