English(EN) CLUBench: A Clustering Benchmark

新的CLUBench基准测试评估AI聚类算法

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-29 04:00

一个名为CLUBench的新基准测试已被开发出来，用于评估跨越不同数据类型（包括表格、文本和图像数据）的聚类算法。该基准测试包含24种算法和131个数据集，涉及超过178,000次实验。初步研究结果表明，深度聚类方法并不显著优于KMeans等传统算法，并且将预训练嵌入与传统方法相结合对于图像和文本聚类是有效的。研究还表明，即使在基础模型兴起的背景下，聚类仍然是一个复杂的问题，并提出在性能矩阵中使用低秩结构以进行高效评估和模型选择。 AI

排序理由该聚类描述了一篇介绍用于评估AI聚类算法的基准测试的新学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Feng Xiao, Dazhi Fu, Chris Ding, Jicong Fan · 2026-05-29 04:00

CLUBench: A Clustering Benchmark

arXiv:2605.29933v1 Announce Type: new Abstract: Clustering is a fundamental problem in data science with a long-standing research history, yielding numerous insightful algorithms. Despite this progress, a systematic and large-scale empirical evaluation that jointly considers conv…

报道来源 [1]

CLUBench: A Clustering Benchmark

相关实体

相关话题