PulseAugur
实时 08:11:02
English(EN) Recovering the Zipfian Distribution in Unsupervised Term Discovery

图聚类在语音术语发现方面优于K-means

研究人员发表了一篇论文,提出基于图的聚类作为无监督语音术语发现的优越方法。与创建均匀分布的K-means等传统基于中心的方法不同,图聚类(特别是使用Leiden算法)能生成更符合齐夫分布的分布,更能代表自然词汇。该方法在三种语言的单词和音节发现方面均表现出优越的性能。 AI

影响 这项研究可能导致语音处理系统中更准确、更自然的词汇生成。

排序理由 学术论文,提出一种新的无监督术语发现方法。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

报道来源 [2]

  1. arXiv cs.CL TIER_1 English(EN) · Danel Slabbert, Simon Malan, Herman Kamper ·

    Recovering the Zipfian Distribution in Unsupervised Term Discovery

    arXiv:2606.10781v1 Announce Type: cross Abstract: Unsupervised term discovery involves segmenting unlabelled speech into word- or syllable-like units and clustering these into a lexicon of candidate types. True lexicons follow a Zipfian distribution, yet the dominant centre-based…

  2. arXiv cs.CL TIER_1 English(EN) · Herman Kamper ·

    Recovering the Zipfian Distribution in Unsupervised Term Discovery

    Unsupervised term discovery involves segmenting unlabelled speech into word- or syllable-like units and clustering these into a lexicon of candidate types. True lexicons follow a Zipfian distribution, yet the dominant centre-based clustering approach -- K-means -- produces a more…