minimum description length
PulseAugur coverage of minimum description length — every cluster mentioning minimum description length across labs, papers, and developer communities, ranked by signal.
2 天有情绪数据
-
新的谱聚类方法使用MDL改进图正则化
研究人员开发了一种新的谱聚类方法,称为MDL-GBTRSC,旨在改进亲和图的构建。该方法利用最小描述长度(MDL)原理构建细粒度球树,有效正则化样本级图。通过保留可靠的局部连通性并使用稳定的叶球进行编码尺度信息,MDL-GBTRSC将表示学习与图构建联系起来。实验表明,该方法在各种数据集上的表现优于现有的谱聚类方法。
-
新的基于MDL的分类器提供可解释、边界感知的分类
研究人员推出了一种新的粒球分类器,该分类器利用最小描述长度(MDL)原理来提高透明度和边界敏感性。这种基于MDL的粒球分类器(MDL-GBC)将粒球的构建公式化为一个局部模型选择问题,比较了单球、双球和核心-边界模型。在18个基准数据集上的实验表明,MDL-GBC取得了有竞争力的性能,在准确率和Macro-F1分数上常常优于现有方法,为传统的启发式方法提供了一种可解释的替代方案。
-
ITBoost 增强梯度提升模型在噪声标签下的鲁棒性
研究人员推出了一种新颖的梯度提升方法 ITBoost,旨在增强模型在表格数据中对抗噪声标签的鲁棒性。与强调具有大梯度样本的传统方法不同,ITBoost 通过检查训练迭代过程中残差的演变来评估样本的可靠性。通过应用最小描述长度(Minimum Description Length)原理,ITBoost 会降低具有不规则残差模式的样本的权重,认为它们不太可信。该方法在理论上提供了在标签噪声下更紧密的泛化界限,并在噪声基准测试中实证证明了性…
-
新AI框架从时间序列中推断空间区域和时间特征
研究人员开发了一种新的非参数框架,用于对空间时间序列数据进行区域化。该方法基于最小描述长度原理,能够有效地推断空间分区和代表性时间原型。它可以准确地恢复合成数据中的植入结构,并从真实的空气质量和植被指数记录中提取有意义的模式。