研究人员开发了一个理论框架,以提高将大型语言模型(LLM)与形式化验证工具集成的可靠性。这个基于 LLM-验证器收敛定理的新系统,为多阶段验证管道中的终止提供了可证明的保证。该模型将过程分解为四个阶段:CodeGen、Compilation、InvariantSynth 和 SMTSolving,证明了在每个阶段具有任何非零成功概率的情况下,系统最终将达到已验证状态。通过广泛的试验,推导并经验性地验证了一个精确的延迟界限 $\mathbb{E}[n] \leq 4/\delta$,显示出与理论预测一致的持续结果。 AI
影响 为使用 LLM 进行安全关键软件验证中的可预测资源规划和性能预算提供了理论基础。
排序理由 学术论文,介绍 LLM-验证器系统的新理论框架和经验验证。[lever_c_demoted from research: ic=1 ai=1.0]
- CodeGen
- Compilation
- Formal Verification
- InvariantSynth
- Large Language Models
- LLM-Verifier Convergence Theorem
- Pierre Dantas
- SMTSolving
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →