PulseAugur
实时 14:45:07
العربية(AR) أطلقت شركة Google طراز الذكاء الاصطناعي Gemma 4 12B مفتوح المصدر، المصمم لتشغيل المهام متعددة الوسائط كالنصوص والصور والصوت محلياً على الحواسيب المحمولة العادية

ElevenLabs 发布 Dubbing v2;Google 发布开源 Gemma 4 12B

ElevenLabs 推出了其 AI 驱动的 Dubbing v2 模型的测试版,该模型旨在跨越 90 多种语言保留翻译语音的原始情感和表演。新模型使用直接语音适配而非文本,并结合了同步感知翻译以实现更好的对齐,目前可通过 ElevenCreativeElevenProductions 使用。Google 还发布了 Gemma 4 12B,这是一个开源 AI 模型,能够使用 16GB RAM 的标准笔记本电脑在本地运行文本、图像和音频处理等多模态任务。该模型在性能上与其较大的 26B 版本相当,但体积减半,并且是首个支持原生音频处理的中等规模模型,可在 Apache 2.0 许可下商用。 AI

影响 新的多模态和翻译模型提供了增强的本地处理和跨语言能力,可能降低内容创作和 AI 应用开发的门槛。

排序理由 该集群包含两大 AI 公司发布的两个不同产品,包括一个开源模型发布。

在 Mastodon — mastodon.social 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

ElevenLabs 发布 Dubbing v2;Google 发布开源 Gemma 4 12B

报道来源 [2]

  1. Mastodon — mastodon.social TIER_1 العربية(AR) · bidjadtech ·

    ElevenLabs launched a new AI-powered dubbing model, Dubbing v2, in its beta phase, which preserves the original emotion and performance of the translated voice in over 90 languages

    أطلقت ElevenLabs نموذج دوبلاج جديد مدعوم بالذكاء الاصطناعي، Dubbing v2، في مرحلته التجريبية، والذي يحافظ على المشاعر والأداء الأصلي للصوت المترجم بأكثر من 90 لغة. يستخدم النموذج التكييف الصوتي المباشر بدلاً من النصوص، ويتميز بترجمة واعية بالتزامن لتحسين المحاذاة، وهو متاح حالياً …

  2. Mastodon — mastodon.social TIER_1 العربية(AR) · bidjadtech ·

    Google launched the open-source Gemma 4 12B AI model, designed to run multimodal tasks such as text, images, and audio locally on ordinary laptops

    أطلقت شركة Google طراز الذكاء الاصطناعي Gemma 4 12B مفتوح المصدر، المصمم لتشغيل المهام متعددة الوسائط كالنصوص والصور والصوت محلياً على الحواسيب المحمولة العادية بذاكرة 16 جيجابايت. يتميز النموذج الجديد بنصف حجم ذاكرة طراز 26B مع تقديم أداء مماثل تقريباً، وهو أول طراز متوسط الحجم …