研究人员引入了一种名为规则违规分数 (RVS) 的新指标来评估预测模型的逻辑合规性,该指标超越了传统的准确性衡量标准。RVS 量化了模型在多大程度上遵守预定义的逻辑或特定领域约束,并区分硬规则和软规则。该指标可应用于任何数据集和模型类型,甚至可以评估训练数据的逻辑一致性并识别定义不佳的规则。在知识图谱链接预测和关系回归基准上的实验表明,具有相似预测准确性的模型可能具有显著不同的逻辑合规性,这是标准指标所忽略的一个区别。 AI
影响 引入了一种新颖的指标来评估模型对逻辑规则的遵守情况,这对于超越简单准确性的高风险 AI 应用至关重要。
排序理由 介绍 AI 模型新评估指标的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
在 arXiv cs.NE (Neural & Evolutionary) 阅读 →
- arXiv
- Horn rules
- Hugging Face
- knowledge graph link prediction
- relational regression
- Rule Violation Score
- SQL
- Tyrex Equipe
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →