PulseAugur
实时 13:53:24
English(EN) Procedural Refinement by LLM-driven Algorithmic Debugging for ARC-AGI-2

LLM应对CUDA调试和抽象推理,带来新基准和方法

两篇新研究论文探讨了大型语言模型(LLM)的高级调试和推理技术。第一篇论文介绍了CUDABeaver,这是一个旨在评估基于LLM的CUDA代码调试的基准,强调了修复过程中性能保持的挑战。第二篇论文提出了基于诱导的程序化改进(ABPR),这是一种结合LLM和Prolog进行算法调试的神经符号方法,在ARC-AGI-2等抽象推理任务上展示了显著的改进。 AI

影响 新的基准和神经符号方法推动了LLM在CUDA调试和抽象推理等专业领域的应用能力。

排序理由 两篇学术论文介绍了LLM应用的新基准和方法论。

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

LLM应对CUDA调试和抽象推理,带来新基准和方法

报道来源 [2]

  1. arXiv cs.LG TIER_1 English(EN) · Shiyang Li, Haoyang Chen, Mattia Fazzini, Caiwen Ding ·

    CUDABeaver:基于LLM的自动化CUDA调试基准测试

    arXiv:2605.08455v2 Announce Type: replace Abstract: Debugging CUDA programs has long been challenging because failures often arise from subtle interactions among hardware behavior, compiler decisions, memory hierarchy, and asynchronous execution. More importantly, with the rapid …

  2. arXiv cs.AI TIER_1 English(EN) · Yu-Ning Qiu, Lin-Feng Zou, Jiong-Da Wang, Xue-Rong Yuan, Wang-Zhou Dai ·

    LLM驱动的算法调试通过ARC-AGI-2进行程序化精炼

    arXiv:2603.20334v4 Announce Type: replace-cross Abstract: In high-complexity abstract reasoning, a system must infer a latent rule from a few examples or structured observations and apply it to unseen instances. LLMs can express such rules as programs, but ordinary conversation-b…