研究人员发表了一篇论文,提出基于图的聚类作为无监督语音术语发现的优越方法。与创建均匀分布的K-means等传统基于中心的方法不同,图聚类(特别是使用Leiden算法)能生成更符合齐夫分布的分布,更能代表自然词汇。该方法在三种语言的单词和音节发现方面均表现出优越的性能。 AI
影响 这项研究可能导致语音处理系统中更准确、更自然的词汇生成。
排序理由 学术论文,提出一种新的无监督术语发现方法。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →
研究人员发表了一篇论文,提出基于图的聚类作为无监督语音术语发现的优越方法。与创建均匀分布的K-means等传统基于中心的方法不同,图聚类(特别是使用Leiden算法)能生成更符合齐夫分布的分布,更能代表自然词汇。该方法在三种语言的单词和音节发现方面均表现出优越的性能。 AI
影响 这项研究可能导致语音处理系统中更准确、更自然的词汇生成。
排序理由 学术论文,提出一种新的无监督术语发现方法。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →
arXiv:2606.10781v1 Announce Type: cross Abstract: Unsupervised term discovery involves segmenting unlabelled speech into word- or syllable-like units and clustering these into a lexicon of candidate types. True lexicons follow a Zipfian distribution, yet the dominant centre-based…
Unsupervised term discovery involves segmenting unlabelled speech into word- or syllable-like units and clustering these into a lexicon of candidate types. True lexicons follow a Zipfian distribution, yet the dominant centre-based clustering approach -- K-means -- produces a more…