研究人员推出了SciRisk-Bench,这是一个旨在评估科学应用(AI4Science)中AI模型安全性的新基准。该基准评估模型识别和规避跨不同科学学科和特定风险维度的能力。SciRisk-Bench涵盖7个学科、31个子学科和10个不同的风险维度,比以往的数据集提供了对科学领域AI安全性的更详细分析。 AI
影响 增强了部署在科学研究中的AI模型的安全评估,可能带来更可靠和更安全的AI4Science应用。
排序理由 该集群描述了一个用于AI安全研究的新学术基准。
在 Hugging Face Daily Papers 阅读 →
- AI4Science
- LLMs
- SciRisk-Bench
- alphaXiv
- arXiv
- CatalyzeX
- Connected Papers
- CORE Recommender
- DagsHub
- Gotit.pub
- Hugging Face
- Litmaps
- ScienceCast
- scite Smart Citations
AI 生成摘要 · Google Gemini · 来自 3 个来源。 我们如何撰写摘要 →