实体
LTX-2
LTX-2
PulseAugur coverage of LTX-2 — every cluster mentioning LTX-2 across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
情绪 · 30 天
1 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
SANA-WM 模型生成时长一分钟的 720p 视频
研究人员发布了 SANA-WM,一个能够生成时长一分钟、分辨率为 720p 的视频的开源世界模型。该扩散 Transformer 模型采用了混合线性注意力机制和双分支架构来实现精确的相机控制。该模型还包含一个两阶段生成流程,并使用精炼器来增强质量和时间一致性,它使用具有度量尺度 6-DoF 相机姿态的强大标注流程进行训练。
-
Resemble AI 发布 Dramabox 具表现力的 TTS 及语音克隆功能
Resemble AI 发布了 Dramabox,一个基于 Lightricks 的 LTX-2 音频分支构建的具表现力的文本转语音模型。该模型利用提示驱动控制说话人身份、情感和语调,并提供使用 10 秒参考音的语音克隆功能。Dramabox 是 LTX-2.3 3.3B 模型的 IC-LoRA 微调版本,以 Gemma 3 12B 文本嵌入为条件。