研究人员推出RecourseBench,一个旨在标准化算法追溯方法评估的新模块化框架。该框架强调模块化、可复现性和交互性,将评估流程分解为五个不同的层级。RecourseBench包含一个自动化测试套件,用于验证集成方法相对于其原始报告结果的可复现性,弥补了先前基准测试中的一个重大空白。该系统目前支持28种最先进的追溯方法,并提供了一个交互式Web界面以实现灵活的比较。 AI
影响 增强了AI追溯方法的可靠性和可比性,可能加速可解释AI的进展。
排序理由 该集群描述了一篇介绍用于评估AI方法框架的新学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
- alphaXiv
- arXiv
- CatalyzeX
- Connected Papers
- DagsHub
- Gotit.pub
- Hugging Face
- Litmaps
- RecourseBench
- ScienceCast
- SciTE
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →