Google 已经测试了其多模态 AI 模型 Gemma 4,该模型展示了超越文本处理的能力。该模型可以分析图像、理解音频,甚至能总结长达 50 分钟的广播剧等冗长音频内容。提供了一个视频演示来展示其功能和局限性。 AI
影响 展示了多模态 AI 的进步,有可能改进图像、音频和文本分析在各种应用中的能力。
排序理由 该集群描述了对多模态 AI 模型的测试,属于 AI 能力的研究与开发范畴。
在 Mastodon — mastodon.social 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →