一篇新发表在arXiv上的论文概述了与自动化事实核查系统相关的风险分类法,特别是那些采用人工智能和大型语言模型的系统。该研究确定了32种具体风险,分为风险因素、危险情况和危害,以解决错误判断的可能性以及随后传播错误信息或诽谤的可能性。该研究还对一个名为DEFAME的系统进行了风险评估,展示了所提出的分类法如何揭示传统IT安全方法(如STRIDE)未识别出的风险。 AI
影响 识别人工智能事实核查中的关键风险,可能指导这些系统更安全地开发和部署。
排序理由 该集群包含一篇研究论文,详细介绍了人工智能驱动系统的新风险分类法。[lever_c_demoted from research: ic=1 ai=1.0]
- alphaXiv
- Artificial Intelligence
- arXiv
- Automated Fact-Checking Systems
- CatalyzeX
- Connected Papers
- DagsHub
- Gotit.pub
- Hugging Face
- Large Language Models
- Litmaps
- ScienceCast
- scite Smart Citations
- STRIDE
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →