PulseAugur
实时 09:15:40
实体 CVSS-C

CVSS-C

PulseAugur coverage of CVSS-C — every cluster mentioning CVSS-C across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天

2 天有情绪数据

最近 · 第 1/1 页 · 共 2 条
  1. RESEARCH · CL_86655 ·

    Audio-LLMs 增强语音翻译数据过滤

    研究人员开发了一种新颖的方法,利用音频大型语言模型 (Audio-LLMs) 来过滤嘈杂的语音到语音翻译 (S2ST) 训练数据。该方法采用两阶段的 Rank-to-Distill 策略,其中初始排序器生成用于保留或丢弃语音对的伪标签,然后训练一个 Audio-LLM 直接从音频中做出这些决策。该模型能有效捕捉声学保真度和跨语言语义一致性,从而在 S2ST 性能上取得显著改进,在基准数据集上 ASR-BLEU 的提升高达 +1.4。

  2. TOOL · CL_36539 ·

    新的S2ST框架使用类型学先验实现更好的多语言翻译

    研究人员开发了S2ST-Omni 2,一个超越简单语言标签的多语言语音到语音翻译新框架。该系统整合了类型学先验,在多层级上构建语言条件化,包括分层编码、动态声学调制和LLM提示。在CVSS-C数据集上的实验表明,S2ST-Omni 2在各项指标上表现优越,消融研究证实了其提出策略的益处。该框架在数据高效翻译方面也显示出潜力,这一点通过使用有限训练数据的日语到英语评估得到了证明。