实体
PHOENIX14T
PHOENIX14T
PulseAugur coverage of PHOENIX14T — every cluster mentioning PHOENIX14T across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天
2 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
新型混合模型提升实时手语生成能力
研究人员开发了HybridSign,一种融合了自回归和扩散技术的新型模型,可实现更高效、实时的手语生成。该方法旨在克服扩散模型的延迟问题和自回归模型的错误累积问题。HybridSign采用多尺度姿态表示和置信度感知因果注意力机制,以增强鲁棒性并捕捉详细的发音器官特征。在基准数据集上的实验表明,HybridSign在生成质量和速度之间取得了卓越的平衡,显著降低了延迟并提高了吞吐量。
-
新的LLM和编码方法提升手语翻译能力
研究人员正在探索利用大型语言模型(LLM)和先进的编码技术来改进手语翻译(SLT)的新方法。一种方法使用GPT-4o生成释义的目标句子,以增强训练数据,提高翻译质量,尤其是在词汇量稀疏的语言中。另一种方法FEA-SLT将面部表情作为语义锚点,以解决手动手语配置中的歧义,在无词汇方法中取得了最先进的成果。此外,SAGE框架引入了段感知视觉标记,通过缩短输入序列长度来创建更高效、可扩展的无词汇SLT模型。