发布检测AI编写代码行的新基准

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-12 04:00

研究人员发布了HybridCodeAuthorship，这是一个新的基准数据集，旨在评估逐行检测AI生成代码的能力。该数据集模拟了真实世界的行业代码库，其中人类编写和AI编写的代码交织在一起，这与现有通常使用学术性或完全由AI或人类编写的代码的基准不同。该数据集是使用GitHub存储库中的Python代码文件构建的。初步基准测试显示，表现最佳的算法AIGCode Detector在块级检测中达到了0.48的F1分数，在行级检测中达到了0.56的F1分数。 AI

影响能够开发更好的工具来管理和分析混合人类和AI编写代码的代码库。

排序理由该集群描述了一个新的AI研究基准数据集。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Luke Patterson, Li Wang, Adam Faulkner · 2026-06-12 04:00

HybridCodeAuthorship: A Benchmark Dataset for Line-Level Code Authorship Detection

arXiv:2606.12620v1 Announce Type: cross Abstract: Thanks to the rapid adoption of AI code assistants powered by large language models (LLMs), industry codebases are, increasingly, a hybrid of AI- and human-authored code. For risk management and productivity analysis purposes, it …

报道来源 [1]

HybridCodeAuthorship: A Benchmark Dataset for Line-Level Code Authorship Detection

相关实体

相关话题