PulseAugur
实时 23:24:50
中文(ZH) 会写字、懂排版、能分镜:HiDream-O1-Image-1.5 全能图像生成能力解析

HiDream.ai 的 HiDream-O1-Image-1.5 以原生多模态架构引领图像生成

HiDream.ai 发布了其商用图像生成模型 HiDream-O1-Image-1.5,该模型在人工智能分析文本到图像排行榜上名列前茅。该模型在渲染文本、复杂场景构图和多主体一致性等复杂任务上表现出色,超越了许多国际竞争对手。这一进步归功于其新颖的原生多模态架构 Unified Transformer (UiT),该架构在基础层面集成了各种数据类型,超越了传统的模块化方法。 AI

影响 为复杂的图像生成任务设定了新的基准,有可能加速原生多模态架构在创意行业的应用。

排序理由 一家公司发布了新的商用模型,该模型在基准测试中取得了顶尖分数,并突出了一种新颖的架构。[lever_c_demoted from significant: ic=1 ai=1.0]

在 雷峰网 (Leiphone) 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

HiDream.ai 的 HiDream-O1-Image-1.5 以原生多模态架构引领图像生成

报道来源 [1]

  1. 雷峰网 (Leiphone) TIER_1 中文(ZH) ·

    Can Write, Understand Layout, and Create Storyboards: An Analysis of HiDream-O1-Image-1.5's All-Around Image Generation Capabilities

    <p>近日,智象未来(HiDream.ai) 全新推出的商用版图像生成模型 HiDream-O1-Image-1.5 再次实现 SOTA,在全球知名独立 AI 模型评测与分析平台 Artificial Analysis的文生图榜单(Text to Image Leaderboard)上,一举登上中国图像生成模型第一,成为评分仅次于OpenAI的中国大模型公司,超越Google Nano Banana 2(Gemini 3.1 Flash Image Preview)、NVIDIA Cosmos3-Super-Text2Image 和字节跳动的Seedre…