PulseAugur
实时 15:13:59
English(EN) Corpus Augmentation for Sign Language Translation via LLM-Guided Video Stitching

LLM通过合成视频数据提升手语翻译

研究人员开发了一种新颖的方法,利用大型语言模型(LLM)来增强手语翻译(SLT)数据集。该方法通过从现有的词汇注释语料库中提取片段,并使用LLM创建新的句子词汇,来生成合成的视频-文本对。合成数据显著提高了SLT性能,在基线之上实现了2.92的BLEU-4增益,而无需额外的人工标注或生成式视频模型。研究还发现,优化片段过渡的视觉平滑度可能适得其反,表明突然的边界可能提供隐式正则化。 AI

影响 通过创建更大、更多样化的训练数据集来增强手语翻译能力,可能提高聋哑和听力障碍社区的可及性。

排序理由 学术论文,详细介绍了手语翻译语料库增强的新方法。

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

报道来源 [2]

  1. arXiv cs.LG TIER_1 English(EN) · Zsolt Robotka, \'Ad\'am R\'ak, Jalal Al-Afandi, Andr\'as Horv\'ath, Gy\"orgy Cserey ·

    Corpus Augmentation for Sign Language Translation via LLM-Guided Video Stitching

    arXiv:2606.11925v1 Announce Type: cross Abstract: Sign language translation (SLT) converts sign language video into spoken language text and holds significant promise for improving accessibility and enabling communication between signing and non-signing communities. While large w…

  2. arXiv cs.LG TIER_1 English(EN) · György Cserey ·

    通过LLM引导的视频拼接进行手语翻译的语料库增强

    Sign language translation (SLT) converts sign language video into spoken language text and holds significant promise for improving accessibility and enabling communication between signing and non-signing communities. While large weakly-aligned datasets have enabled pre-training a…