中文(ZH) 会写字、懂排版、能分镜：HiDream-O1-Image-1.5 全能图像生成能力解析

HiDream.ai 的 HiDream-O1-Image-1.5 以原生多模态架构引领图像生成

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-10 15:43

HiDream.ai 发布了其商用图像生成模型 HiDream-O1-Image-1.5，该模型在人工智能分析文本到图像排行榜上名列前茅。该模型在渲染文本、复杂场景构图和多主体一致性等复杂任务上表现出色，超越了许多国际竞争对手。这一进步归功于其新颖的原生多模态架构 Unified Transformer (UiT)，该架构在基础层面集成了各种数据类型，超越了传统的模块化方法。 AI

影响为复杂的图像生成任务设定了新的基准，有可能加速原生多模态架构在创意行业的应用。

排序理由一家公司发布了新的商用模型，该模型在基准测试中取得了顶尖分数，并突出了一种新颖的架构。[lever_c_demoted from significant: ic=1 ai=1.0]

在雷峰网 (Leiphone) 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

HiDream.ai 的 HiDream-O1-Image-1.5 以原生多模态架构引领图像生成

报道来源 [1]

雷峰网 (Leiphone) TIER_1 中文(ZH) · 2026-06-10 15:43

能写、懂排版、会画故事板：HiDream-O1-Image-1.5 全能图像生成能力分析

<p>近日，智象未来（HiDream.ai）全新推出的商用版图像生成模型 HiDream-O1-Image-1.5 再次实现 SOTA，在全球知名独立 AI 模型评测与分析平台 Artificial Analysis的文生图榜单（Text to Image Leaderboard）上，一举登上中国图像生成模型第一，成为评分仅次于OpenAI的中国大模型公司，超越Google Nano Banana 2（Gemini 3.1 Flash Image Preview）、NVIDIA Cosmos3-Super-Text2Image 和字节跳动的Seedre…

报道来源 [1]

能写、懂排版、会画故事板：HiDream-O1-Image-1.5 全能图像生成能力分析

相关实体

相关话题