Clark Labs 将文本到图像模型压缩至 374MB，采用三元量化

作者 PulseAugur 编辑部 · [2 个来源] · 2026-06-28 05:10

Clark Labs 发布了 Clark Air，这是一个拥有 16 亿参数的文本到图像 Transformer 模型，已压缩至每权重约 1.85 位。这种量化使得模型大小比其 FP16 等效模型小 8.6 倍，将打包文件大小减至 374 MB，同时保持接近 FP16 的质量。该模型基于 Sana 1.6B 架构，并采用三元量化，在条件和投影层使用少量高精度尾部。 AI

影响使得在存储和计算资源有限的设备上部署先进的文本到图像模型成为可能。

排序理由发布了具有性能指标的量化模型。

在 r/LocalLLaMA 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

r/LocalLLaMA TIER_1 English(EN) · /u/pmttyji · 2026-06-28 05:10

clark-labs/clark-air-sana-1.6b-1.58bit · Hugging Face

<table> <tr><td> <a href="https://www.reddit.com/r/LocalLLaMA/comments/1uhobd0/clarklabsclarkairsana16b158bit_hugging_face/"> <img alt="clark-labs/clark-air-sana-1.6b-1.58bit · Hugging Face" src="https://external-preview.redd.it/zfvkx31-NM_6KccYq9q1OexxZ6aookbW9oDQ8RFfnSM.png?wid…
r/StableDiffusion TIER_2 English(EN) · /u/LumenLime · 2026-06-28 05:30

clark-labs/clark-air-sana-1.6b-1.58bit · Hugging Face

<div class="md"><p><a href="https://huggingface.co/clark-labs/clark-air-sana-1.6b-1.58bit">https://huggingface.co/clark-labs/clark-air-sana-1.6b-1.58bit</a></p> <p><strong>A Sana 1.6B text-to-image transformer compressed to ternary (~1.85 bits/weight): 8.6× smaller…

报道来源 [2]

clark-labs/clark-air-sana-1.6b-1.58bit · Hugging Face

clark-labs/clark-air-sana-1.6b-1.58bit · Hugging Face

相关实体

相关话题