PulseAugur
实时 03:40:07
English(EN) PixelDiT — 1.3B pixel-space diffusion transformer, no VAE, 4GB VRAM, now 100% diffusers compatible with Qwen encoder support

PixelDiT 扩散 Transformer 发布,支持 Qwen 编码器

一款名为 PixelDiT 的新型扩散 Transformer 模型已发布,拥有 13 亿参数,直接在像素空间运行,无需 VAE。该模型设计高效,仅需 4GB VRAM,并与 Hugging Face Diffusers 库完全兼容。它还集成了对 Qwen 编码器的支持,增强了其功能。 AI

影响 为图像生成任务提供了一个新的、高效的扩散模型。

排序理由 发布了一个具有技术规格的新开源模型。[lever_c_降级自研究:ic=1 ai=1.0]

在 r/StableDiffusion 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

PixelDiT 扩散 Transformer 发布,支持 Qwen 编码器

报道来源 [1]

  1. r/StableDiffusion TIER_2 English(EN) · /u/madtune22 ·

    PixelDiT — 1.3B 像素空间扩散 Transformer,无 VAE,4GB 显存,现已 100% 兼容 diffusers 并支持 Qwen 编码器

    <table> <tr><td> <a href="https://www.reddit.com/r/StableDiffusion/comments/1tuco68/pixeldit_13b_pixelspace_diffusion_transformer_no/"> <img alt="PixelDiT — 1.3B pixel-space diffusion transformer, no VAE, 4GB VRAM, now 100% diffusers compatible with Qwen encoder support" src="htt…