一项新的研究论文揭示,当前评估代码生成中偏见的方法严重低估了该问题。通过分析机器学习流水线的生成过程,研究人员发现,在生成的流水线中,敏感属性出现的比例高达 87.7%,远高于之前在更简单的条件语句中观察到的比例。这表明现有基准测试未能充分捕捉现实世界 AI 应用中的偏见风险。 AI
影响 当前代码生成的偏见评估方法不足,可能导致已部署 AI 系统中的偏见风险被低估。
排序理由 评估代码生成中偏见的学术论文。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →