PulseAugur
EN
LIVE 14:42:38
العربية(AR) أطلقت شركة Google طراز الذكاء الاصطناعي Gemma 4 12B مفتوح المصدر، المصمم لتشغيل المهام متعددة الوسائط كالنصوص والصور والصوت محلياً على الحواسيب المحمولة العادية

ElevenLabs launches Dubbing v2; Google releases open-source Gemma 4 12B

ElevenLabs has launched a beta version of its AI-powered Dubbing v2 model, which aims to preserve the original emotion and performance of translated speech across over 90 languages. This new model utilizes direct voice adaptation instead of text and incorporates synchronization-aware translation for better alignment, and is currently available through ElevenCreative and ElevenProductions. Google has also released Gemma 4 12B, an open-source AI model capable of running multimodal tasks like text, image, and audio processing locally on standard laptops with 16GB of RAM. This model offers similar performance to its larger 26B counterpart while being half the size and is the first medium-sized model to support native audio processing, available for commercial use under an Apache 2.0 license. AI

IMPACT New multimodal and translation models offer enhanced local processing and cross-lingual capabilities, potentially lowering barriers for content creation and AI application development.

RANK_REASON The cluster contains two distinct product releases from major AI companies, including an open-source model release.

Read on Mastodon — mastodon.social →

AI-generated summary · Google Gemini · from 2 sources. How we write summaries →

ElevenLabs launches Dubbing v2; Google releases open-source Gemma 4 12B

COVERAGE [2]

  1. Mastodon — mastodon.social TIER_1 العربية(AR) · bidjadtech ·

    ElevenLabs launched a new AI-powered dubbing model, Dubbing v2, in its beta phase, which preserves the original emotion and performance of the translated voice in over 90 languages

    أطلقت ElevenLabs نموذج دوبلاج جديد مدعوم بالذكاء الاصطناعي، Dubbing v2، في مرحلته التجريبية، والذي يحافظ على المشاعر والأداء الأصلي للصوت المترجم بأكثر من 90 لغة. يستخدم النموذج التكييف الصوتي المباشر بدلاً من النصوص، ويتميز بترجمة واعية بالتزامن لتحسين المحاذاة، وهو متاح حالياً …

  2. Mastodon — mastodon.social TIER_1 العربية(AR) · bidjadtech ·

    Google launched the open-source Gemma 4 12B AI model, designed to run multimodal tasks such as text, images, and audio locally on ordinary laptops

    أطلقت شركة Google طراز الذكاء الاصطناعي Gemma 4 12B مفتوح المصدر، المصمم لتشغيل المهام متعددة الوسائط كالنصوص والصور والصوت محلياً على الحواسيب المحمولة العادية بذاكرة 16 جيجابايت. يتميز النموذج الجديد بنصف حجم ذاكرة طراز 26B مع تقديم أداء مماثل تقريباً، وهو أول طراز متوسط الحجم …