阿里巴巴的 Qwen 团队发布了 Qwen/Qwen3-ForcedAligner-0.6B-hf,这是一个专为强制对齐任务设计的 token 分类模型。该模型的卡片表明其能够对长达五分钟的语音片段进行时间戳预测,支持十一种语言。此模型根据 Apache 2.0 许可证发布。 AI
影响 为多种语言的强制对齐和时间戳预测任务提供了一个专用工具。
排序理由 发布了一个来自知名实验室的特定、较小模型,而非旗舰前沿模型。[lever_c_demoted from research: ic=1 ai=1.0]
在 Mastodon — mastodon.social 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →