PulseAugur
实时 11:09:40
实体 MOSS-Audio

MOSS-Audio

PulseAugur coverage of MOSS-Audio — every cluster mentioning MOSS-Audio across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 2 条
  1. TOOL · CL_65587 ·

    MOSS-Audio 模型发布,实现统一音频理解

    研究人员发布了 MOSS-Audio,这是一款统一的音频-语言模型,旨在理解语音、环境声音和音乐。该模型采用专用的音频编码器和大型语言模型,并融入了跨层特征注入和时间标记等功能,以增强时间理解能力。MOSS-Audio 提供 4B 和 8B 参数版本,在音频字幕、语音转录和推理等各种音频任务中表现出色,有望成为未来语音代理的基础。

  2. RESEARCH · CL_07787 ·

    MOSI.AI的MOSS-Audio模型以统一方法彻底改变音频分析

    MOSI.AI与上海创新中心开发了一个名为MOSS-Audio的新音频分析模型。该模型将音频作为一个统一的整体进行处理,能够同时进行语音转录、情感识别和声学事件解释。MOSS-Audio旨在提供对音频内容的全面推理,超越碎片化解决方案。