研究人员推出了 ASSEMBLAGE-DEEPHISTORY,这是一个新颖的数据集,旨在帮助分析不同构建配置和历史版本中的软件漏洞。该数据集包含来自 248 个开源项目的 73,000 多个二进制文件,使用各种编译器和操作系统进行编译,并包含将二进制文件与其源代码、易受攻击的函数和包版本相关联的详细元数据。进行了三项分析以证明该数据集的实用性,包括用于漏洞检测的大语言模型基准测试、用于聚类的嵌入比较以及二进制相似性的回归分析。 AI
影响 为训练和评估人工智能模型在不同构建环境中识别软件漏洞提供了新资源。
排序理由 该集群包含一篇学术论文,详细介绍了用于软件漏洞分析的新数据集和基准测试。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →