研究人员开发了MPC-Patch-Bench,这是一个新的基准,旨在评估大型语言模型(LLM)在安全多方计算(MPC)软件方面的代码修复能力。现有的通用基准由于其独特的加密逻辑、缺乏标准化测试以及对加密安全性的关键需求,对于MPC来说是不够的。MPC-Patch-Bench包含一个数据策展框架和一个专门的MPC验证器,以确保功能正确性和安全性,从而解决了当前评估方法的局限性。 AI
影响 为评估LLM在安全多方计算这一关键领域的代码修复能力建立了专门的基准。
排序理由 该集群包含一篇研究论文,介绍了一个用于评估LLM在特定领域能力的基准。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →