研究人员推出了SynCred-Bench,这是一个旨在评估AI检测人工智能生成视觉错误信息中合成可信度能力的新基准。该基准包含600张AI生成的图像和一组真实图像,用于衡量误报率。评估显示,包括开源检测器和商业API在内的当前AI系统在可靠识别此类错误信息方面存在困难,人工标注者也面临挑战。 AI
影响 凸显了AI在辨别复杂视觉错误信息方面的重大差距,有必要开发新的检测方法。
排序理由 该集群包含一篇介绍新基准以评估AI系统的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →