PulseAugur
实时 13:09:00
实体 ERNIE Team

ERNIE Team

PulseAugur coverage of ERNIE Team — every cluster mentioning ERNIE Team across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 2 条
  1. TOOL · CL_68730 ·

    百度发布NAVA,一个拥有63亿参数的视听生成模型

    百度发布了NAVA,一个拥有63亿参数的模型,能够根据单一文本提示生成同步的音频和视频。该模型采用了Align-then-Fuse MMDiT架构,在视听同步基准测试中取得了最先进的性能。NAVA可以在大约一分钟内生成720p、一分钟长的视频和立体声音频,并能精确控制说话者的声音音色。

  2. SIGNIFICANT · CL_63407 ·

    百度ERNIE团队发布NAVA视听生成模型

    百度ERNIE团队发布了NAVA,一个拥有63亿参数的模型,能够根据单一文本提示生成同步的音频和视频。NAVA采用了Align-then-Fuse MMDiT架构,在Verse-Bench等音频-视频同步和视频质量基准测试中取得了最先进的性能。该模型可以在大约一分钟内生成一分钟的720p视频和同步音频,并提供精确的多音色控制和语言描述的摄像机控制等功能。