研究人员开发了一种新颖的方法,可以在不依赖显式文本监督的情况下创建口语词汇。该方法使用图像及其语音描述来构建书面词汇表,然后将它们与相关的音频片段对齐。该系统利用无监督词发现技术将口语片段与其书面对应词联系起来,在口语检索和关键词识别任务中表现出有效性。 AI
影响 支持低资源语言开发,并提高语音转文本系统的可解释性。
排序理由 该集群包含一篇在 arXiv 上发表的学术论文,详细介绍了一种新的研究方法。
- alphaXiv
- arXiv
- CatalyzeX
- Connected Papers
- CORE Recommender
- DagsHub
- Gabriel Pirlogeanu
- Gotit.pub
- Hugging Face
- Litmaps
- ScienceCast
- scite Smart Citations
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →