PulseAugur
实时 21:29:16
中文(ZH) 拆解有道“子曰4”全量开源:如何通过重构思维链打下落地成本?

有道开源“子曰4”多模态大模型,降低成本

网易有道宣布对其“子曰4”大语言模型进行重大升级,现已进入多模态时代,支持文本、图像和音频交互。该公司正开源其核心多模态和文本到语音(TTS)模型,旨在降低开发者的落地成本。新模型在视觉数学推理方面展现出最先进的性能,并将推理链输出长度缩短了43.2%,从而降低了推理成本。 AI

影响 降低了开发者在多模态和语音合成方面的门槛,可能加速AI Agent的开发和采用。

排序理由 这是来自一家AI领域主要科技公司的重磅产品发布和开源计划。[lever_c_demoted from significant: ic=1 ai=1.0]

在 雷峰网 (Leiphone) 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

有道开源“子曰4”多模态大模型,降低成本

报道来源 [1]

  1. 雷峰网 (Leiphone) TIER_1 中文(ZH) ·

    Deconstructing Youdao's 'Zhi Yue 4' Fully Open Source: How to Reduce Implementation Costs Through Refactored Chain-of-Thought?

    <p>近日,网易有道宣布“子曰”大模型迎来 4.0 版本的全方位升级。“子曰4&quot; 正式迈入全模态时代,不仅全面支持文本、图片、音频的融合交互,有道更宣布将核心的“多模态模型”与“语音合成(TTS)模型”正式开源。与此同时,翻译模型也迎来了深度的技术重构,翻译质量与效率实现双重提升。多模态模型视觉与数理斩获SOTA,纯文本数理难题性能行业领先据介绍,开源的“子曰4”多模态模型在 27B 参数规模上,面向教育场景,将支持视觉输入的数理能力拉到了行业顶尖水平(SOTA)。在同等参数规模的模型中,“子曰4”在处理带图表的数学题、物理题等高难度视觉数理问…