English(EN) Taming System Complexity: Demystifying Software Engineering Agents in Diagnosing Linux Kernel Faults

AI 代理在 Linux 内核故障诊断方面遇到困难，新基准测试显示

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-02 04:00

研究人员开发了一个新的基准测试 LinuxFLBench，用于评估 AI 代理在诊断 Linux 内核故障方面的有效性。现有的最先进代理在该复杂任务上面临困难，在文件级别的 top-1 准确率仅为 41.6%。为解决此问题，该团队还提出了 LinuxFL$^+ $，一个显著提高了这些代理在 Linux 内核故障定位准确性的框架。 AI

影响新的基准测试和框架可能加速 AI 在关键系统软件维护中的作用。

排序理由学术论文，介绍了一个用于 AI 故障定位的新基准测试和框架。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Zhenhao Zhou, Zhuochen Huang, Yike He, Chong Wang, Jiajun Wang, Yijian Wu, Xin Peng, Yiling Lou · 2026-06-02 04:00

Taming System Complexity: Demystifying Software Engineering Agents in Diagnosing Linux Kernel Faults

arXiv:2505.19489v2 Announce Type: replace Abstract: The Linux kernel is a critical system, serving as the foundation for numerous systems. Bugs in the Linux kernel can cause serious consequences, affecting billions of users. Fault localization (FL), which aims at identifying the …

报道来源 [1]

Taming System Complexity: Demystifying Software Engineering Agents in Diagnosing Linux Kernel Faults

相关实体

相关话题