English(EN) Who Evaluates AI's Social Impacts? Mapping Coverage and Gaps in First and Third Party Evaluations

人工智能社会影响评估显示存在关键差距，需要提高透明度

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-02 04:00

一项对人工智能社会影响评估的新分析揭示了当前报告实践中存在的重大差距。该研究审查了186份第一方发布报告和248份第三方来源，发现尽管独立评估者对偏见和有害内容提供了更全面的评估，但第一方报告通常流于表面且细节日益减少。除非受到合规性或产品采用的强制要求，否则开发人员会优先降低对数据来源、劳动力成本和基础设施的披露，这凸显了制定政策以强制开发人员透明化并加强独立评估生态系统的迫切需求。 AI

影响强调了对人工智能社会风险进行标准化和透明化报告的必要性，可能影响未来的治理和开发实践。

排序理由分析人工智能评估实践的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Anka Reuel, Avijit Ghosh, Jenny Chim, Andrew Tran, Yanan Long, Jennifer Mickel, Usman Gohar, Srishti Yadav, Pawan Sasanka Ammanamanchi, Mowafak Allaham, Hossein A. Rahmani, Mubashara Akhtar, Felix Friedrich, Robert Scholz, Michael Alexander Riegler, Jan … · 2026-06-02 04:00

Who Evaluates AI's Social Impacts? Mapping Coverage and Gaps in First and Third Party Evaluations

arXiv:2511.05613v2 Announce Type: replace-cross Abstract: Foundation models are increasingly central to high-stakes AI systems, and governance frameworks now depend on evaluations to assess their risks and capabilities. Although general capability evaluations are widespread, soci…

报道来源 [1]

Who Evaluates AI's Social Impacts? Mapping Coverage and Gaps in First and Third Party Evaluations

相关实体

相关话题