PulseAugur
实时 09:14:02

HiDream-ai 发布 8B 图像模型,采用统一像素和文本 Transformer

HiDream-ai 发布了 HiDream-O1-Image,这是一款基于像素级统一 Transformer 架构的 80 亿参数图像生成模型。该模型原生处理原始像素和文本,无需外部 VAE 或单独的文本编码器,能够执行高达 2048x2048 分辨率的文本到图像生成、图像编辑和主题驱动的个性化等任务。该模型还配备了用于增强生成的 Reasoning-Driven Prompt Agent,并在 Artificial Analysis Text to Image Arena 中取得了高排名。 AI

影响 为高分辨率图像生成和编辑任务提供了一个新的开源选项。

排序理由 来自非前沿实验室的开源模型发布,附有技术报告和基准性能。 [lever_c_research降级:ic=1 ai=1.0]

在 Hugging Face Trending Models 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. Hugging Face Trending Models TIER_1 English(EN) · HiDream-ai ·

    HiDream-ai/HiDream-O1-Image

    image-text-to-image · 24,939 downloads · 427 likes