研究人员开发了一种名为分类错误敏感性指数 (ISEC) 的新指标,用于识别和排序手动数据录入系统中易混淆的类别对。该指数整合了语义距离、自定义形态转换成本和经验频率,以创建预防性框架。ISEC 旨在通过检测其分类数据资产中的结构性风险,帮助中小型企业 (SMEs) 主动管理数据治理,与传统方法相比,性能有了显著提升。 AI
影响 为改进手动录入系统中的数据质量提供新工具,可能影响下游AI模型的性能。
排序理由 介绍数据质量新指标的学术论文。[lever_c_demoted from research: ic=1 ai=0.7]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →