PulseAugur
实时 17:12:30

Prism ML 发布紧凑型 Bonsai Image 4B 扩散模型

Prism ML 发布了 Bonsai Image 4B,这是一款利用三元权重实现显著尺寸缩减的文本到图像扩散模型。该模型提供两个版本:一个使用 MLX 针对 Apple Silicon 进行了优化,另一个使用 Gemlite 部署针对 NVIDIA GPU 进行了优化。尽管尺寸紧凑,该模型仍能实现快速生成速度,尽管用户指出文本渲染效果可能不佳,但其他图像方面却出奇地好。 AI

影响 提供高度压缩的文本到图像模型,有可能在边缘设备和消费级硬件上实现更广泛的部署。

排序理由 这是一个采用新颖量化技术的新模型发布,但它并非来自前沿实验室,也不代表行业重大转变。

在 Hugging Face Trending Models 阅读 →

AI 生成摘要 · Google Gemini · 来自 3 个来源。 我们如何撰写摘要 →

报道来源 [3]

  1. Hugging Face Trending Models TIER_1 English(EN) · prism-ml ·

    prism-ml/bonsai-image-ternary-4B-mlx-2bit

    text-to-image · 0 downloads · 44 likes

  2. Hugging Face Trending Models TIER_1 English(EN) · prism-ml ·

    prism-ml/bonsai-image-ternary-4B-gemlite-2bit

    text-to-image · 0 downloads · 48 likes

  3. r/StableDiffusion TIER_2 English(EN) · /u/dh7net ·

    测试新的 prismML Bonsai Image 4B

    <!-- SC_OFF --><div class="md"><p>I just tested the new Bonsai Image 4B (ternary variant).</p> <p>It is super fast: 4.2 seconds per 1024×1024 image at 4 steps on a spark GX10.</p> <p>The results are bad for text, but surprisingly good for everything else.</p> <p>You can see by yo…