PulseAugur
实时 10:27:08

Clark Labs 将文本到图像模型压缩至 374MB,采用三元量化

Clark Labs 发布了 Clark Air,这是一个拥有 16 亿参数的文本到图像 Transformer 模型,已压缩至每权重约 1.85 位。这种量化使得模型大小比其 FP16 等效模型小 8.6 倍,将打包文件大小减至 374 MB,同时保持接近 FP16 的质量。该模型基于 Sana 1.6B 架构,并采用三元量化,在条件和投影层使用少量高精度尾部。 AI

影响 使得在存储和计算资源有限的设备上部署先进的文本到图像模型成为可能。

排序理由 发布了具有性能指标的量化模型。

在 r/LocalLLaMA 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

Clark Labs 将文本到图像模型压缩至 374MB,采用三元量化

报道来源 [2]

  1. r/LocalLLaMA TIER_1 English(EN) · /u/pmttyji ·

    clark-labs/clark-air-sana-1.6b-1.58bit · Hugging Face

    <table> <tr><td> <a href="https://www.reddit.com/r/LocalLLaMA/comments/1uhobd0/clarklabsclarkairsana16b158bit_hugging_face/"> <img alt="clark-labs/clark-air-sana-1.6b-1.58bit · Hugging Face" src="https://external-preview.redd.it/zfvkx31-NM_6KccYq9q1OexxZ6aookbW9oDQ8RFfnSM.png?wid…

  2. r/StableDiffusion TIER_2 English(EN) · /u/LumenLime ·

    clark-labs/clark-air-sana-1.6b-1.58bit · Hugging Face

    <!-- SC_OFF --><div class="md"><p><a href="https://huggingface.co/clark-labs/clark-air-sana-1.6b-1.58bit">https://huggingface.co/clark-labs/clark-air-sana-1.6b-1.58bit</a></p> <p><strong>A Sana 1.6B text-to-image transformer compressed to ternary (~1.85 bits/weight): 8.6× smaller…