研究人员发布了HybridCodeAuthorship,这是一个新的基准数据集,旨在评估逐行检测AI生成代码的能力。该数据集模拟了真实世界的行业代码库,其中人类编写和AI编写的代码交织在一起,这与现有通常使用学术性或完全由AI或人类编写的代码的基准不同。该数据集是使用GitHub存储库中的Python代码文件构建的。初步基准测试显示,表现最佳的算法AIGCode Detector在块级检测中达到了0.48的F1分数,在行级检测中达到了0.56的F1分数。 AI
影响 能够开发更好的工具来管理和分析混合人类和AI编写代码的代码库。
排序理由 该集群描述了一个新的AI研究基准数据集。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →