PulseAugur
实时 18:32:34
English(EN) Holding the FP8 Quality Ceiling at 8-Bit Weights and Activations: INT8 and GGUF Post-Training Quantization of Ideogram 4.0 for Consumer GPUs

新的量化方法使 Ideogram 4.0 能够在消费级 GPU 上运行

研究人员为 Ideogram 4.0 文本到图像扩散 Transformer 开发了新的训练后量化技术。他们的 INT8 W8A8 方法在缺乏 FP8 张量核心的消费级 GPU 上保持了 FP8 质量,性能优于 NF4 量化。此外,他们的 GGUF Q4_K 量化提供了比 NF4 更好的质量-内存权衡。 AI

影响 使先进的文本到图像模型能够在低端硬件上运行,可能拓宽访问范围和用例。

排序理由 该集群包含一篇详细介绍模型量化技术新研究的学术论文。

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 3 个来源。 我们如何撰写摘要 →

新的量化方法使 Ideogram 4.0 能够在消费级 GPU 上运行

报道来源 [3]

  1. arXiv cs.LG TIER_1 English(EN) · Deep Gandhi, Ali Asaria, Tony Salomone ·

    在 8 位权重和激活下保持 FP8 质量上限:用于消费级 GPU 的 Ideogram 4.0 的 INT8 和 GGUF 训练后量化

    arXiv:2606.12280v1 Announce Type: new Abstract: Post-training quantization lets large text-to-image diffusion transformers run on consumer GPUs, yet the hardware-specific trade-offs are seldom measured directly. We quantize Ideogram 4.0 - a 9.3B flow-matching diffusion transforme…

  2. arXiv cs.LG TIER_1 English(EN) · Tony Salomone ·

    将 FP8 质量上限保持在 8 位权重和激活:用于消费级 GPU 的 Ideogram 4.0 的 INT8 和 GGUF 训练后量化

    Post-training quantization lets large text-to-image diffusion transformers run on consumer GPUs, yet the hardware-specific trade-offs are seldom measured directly. We quantize Ideogram 4.0 - a 9.3B flow-matching diffusion transformer (DiT), shipped as two separate-weight copies o…

  3. r/StableDiffusion TIER_2 English(EN) · /u/OriginalSpread3100 ·

    可在3090或更低显卡上运行的最高质量Ideogram 4.0量化模型

    <table> <tr><td> <a href="https://www.reddit.com/r/StableDiffusion/comments/1u37xho/highest_quality_ideogram_40_quantizations_that/"> <img alt="Highest quality Ideogram 4.0 quantizations that run on a 3090 or smaller cards" src="https://preview.redd.it/hn9hfzko8p6h1.png?width=140…