研究人员开发了WARDEN系统,该系统旨在将濒危的Wardaman语言转录和翻译成英语,尽管只有六小时的训练数据。该系统采用两阶段方法,首先将音频转换为语音转录,然后将该转录翻译成英语。为了克服数据稀缺性,WARDEN在转录初始化阶段使用巽他语模型,在翻译阶段使用编译好的Wardaman-英语词典。据报道,这种方法在极低资源场景下的表现优于大型模型。 AI
影响 展示了一种新颖的人工智能方法,以最少的数据帮助保护濒危语言。
排序理由 该集群描述了一篇介绍低资源语言处理新系统的研究论文。
在 Hugging Face Daily Papers 阅读 →
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →