实体 QuantCall

QuantCall

PulseAugur coverage of QuantCall — every cluster mentioning QuantCall across labs, papers, and developer communities, ranked by signal.

总计 · 30天

1

90 天内 1

发布 · 30天

0

90 天内 0

论文 · 30天

0

90 天内 0

层级分布 · 90 天

主题

情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条

TOOL · CL_126515 · Jul 5 · 17:27

量化对 LLM 工具调用的影响在低端硬件上进行了测量

一项新的基准测试 QuantCall 被开发出来，用于评估量化对小型语言模型工具调用能力的影响。该基准测试在 4GB 笔记本 GPU 上运行，发现模型家族比模型大小更能预测量化下的性能。具体来说，Qwen3-0.6B 在 Q4 量化下仍能很好地保持模式有效性，而 Llama-3.2-1B 即使在更高量化水平下也表现出脆弱的模式有效性。研究还表明，更难的多工具任务会加剧量化引起的性能下降，并且受限解码或不同的服务后端并未显著改善结果。