PulseAugur
实时 12:51:02
实体 SCDBench

SCDBench

PulseAugur coverage of SCDBench — every cluster mentioning SCDBench across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_58686 ·

    新的 SCDBench 基准测试揭示 LLM 在智能合约反编译方面存在困难

    引入了一个名为 SCDBench 的新基准测试,用于评估用于智能合约反编译的大型语言模型 (LLM)。该基准测试包含一个包含 600 个真实 Solidity 合约的数据集,并配有字节码、真实源代码和语义检查点。当前的尖端 LLM,如 Claude Opus 4.7 和 GPT-5.3-Codex,在生成结构化和可编译代码方面显示出潜力,但在语义一致性方面存在困难,最好的模型也只能完美反编译 42 个合约。研究还发现,纳入编译修复可以…