PulseAugur
实时 08:44:03

发布检测AI编写代码行的新基准

研究人员发布了HybridCodeAuthorship,这是一个新的基准数据集,旨在评估逐行检测AI生成代码的能力。该数据集模拟了真实世界的行业代码库,其中人类编写和AI编写的代码交织在一起,这与现有通常使用学术性或完全由AI或人类编写的代码的基准不同。该数据集是使用GitHub存储库中的Python代码文件构建的。初步基准测试显示,表现最佳的算法AIGCode Detector在块级检测中达到了0.48的F1分数,在行级检测中达到了0.56的F1分数。 AI

影响 能够开发更好的工具来管理和分析混合人类和AI编写代码的代码库。

排序理由 该集群描述了一个新的AI研究基准数据集。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Luke Patterson, Li Wang, Adam Faulkner ·

    HybridCodeAuthorship: A Benchmark Dataset for Line-Level Code Authorship Detection

    arXiv:2606.12620v1 Announce Type: cross Abstract: Thanks to the rapid adoption of AI code assistants powered by large language models (LLMs), industry codebases are, increasingly, a hybrid of AI- and human-authored code. For risk management and productivity analysis purposes, it …