PulseAugur
实时 15:37:52
English(EN) ASSEMBLAGE-DEEPHISTORY: A Cross-Build Binary Dataset with Temporal Coverage

新数据集助力大语言模型分析软件漏洞

研究人员推出了 ASSEMBLAGE-DEEPHISTORY,这是一个新颖的数据集,旨在帮助分析不同构建配置和历史版本中的软件漏洞。该数据集包含来自 248 个开源项目的 73,000 多个二进制文件,使用各种编译器和操作系统进行编译,并包含将二进制文件与其源代码、易受攻击的函数和包版本相关联的详细元数据。进行了三项分析以证明该数据集的实用性,包括用于漏洞检测的大语言模型基准测试、用于聚类的嵌入比较以及二进制相似性的回归分析。 AI

影响 为训练和评估人工智能模型在不同构建环境中识别软件漏洞提供了新资源。

排序理由 该集群包含一篇学术论文,详细介绍了用于软件漏洞分析的新数据集和基准测试。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.LG TIER_1 English(EN) · Chang Liu, Noah Fleischmann, Nicol\`o Altamura, Edward Raff, James Holt, Kristopher Micinski ·

    ASSEMBLAGE-DEEPHISTORY: 具有时间覆盖的跨构建二进制数据集

    arXiv:2605.21615v1 Announce Type: cross Abstract: Existing binary corpora typically capture only one or two axes of binary variation: they either provide cross-compiler builds without a temporal axis, or CVE labels for single-build binaries. None combine cross-build diversity, cr…