实体 MOSS-Audio

MOSS-Audio

PulseAugur coverage of MOSS-Audio — every cluster mentioning MOSS-Audio across labs, papers, and developer communities, ranked by signal.

总计 · 30天

2

90 天内 2

发布 · 30天

0

90 天内 0

论文 · 30天

2

90 天内 2

层级分布 · 90 天

主题

情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 2 条

TOOL · CL_65587 · Jun 2 · 04:00

MOSS-Audio 模型发布，实现统一音频理解

研究人员发布了 MOSS-Audio，这是一款统一的音频-语言模型，旨在理解语音、环境声音和音乐。该模型采用专用的音频编码器和大型语言模型，并融入了跨层特征注入和时间标记等功能，以增强时间理解能力。MOSS-Audio 提供 4B 和 8B 参数版本，在音频字幕、语音转录和推理等各种音频任务中表现出色，有望成为未来语音代理的基础。
RESEARCH · CL_07787 · Apr 28 · 17:19

MOSI.AI的MOSS-Audio模型以统一方法彻底改变音频分析

MOSI.AI与上海创新中心开发了一个名为MOSS-Audio的新音频分析模型。该模型将音频作为一个统一的整体进行处理，能够同时进行语音转录、情感识别和声学事件解释。MOSS-Audio旨在提供对音频内容的全面推理，超越碎片化解决方案。