实体
llama-cli
llama-cli
PulseAugur coverage of llama-cli — every cluster mentioning llama-cli across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
0
90 天内 0
层级分布 · 90 天
主题
情绪 · 30 天
2 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
llama-bench 针对闪存注意力和 GPU 层数进行了默认值更正
最近为 llama-bench 工具发布的 b9437 版本更正了与闪存注意力和 GPU 层数相关的默认设置。此前,该工具即使在兼容硬件上也将闪存注意力硬编码为关闭,并为 GPU 层数使用了旧的哨兵值。此次更新现在将闪存注意力默认设置为在 सक्षम 硬件(CUDA、Metal、Vulkan)上自动激活,并将 GPU 层数设置为 -1,与其他 llama.cpp 工具(如 llama-server 和 llama-cli)保持一致。此…
-
Qwen3.6-27B-MTP-pi-tune-GGUF 模型现已可用于各种 AI 工具
bytkim/Qwen3.6-27B-MTP-pi-tune-GGUF 模型现已可与各种流行的 AI 工具和库一起使用。提供了将其与 llama-cpp-python、llama.cpp、vLLM、Ollama 和 Unsloth Studio 集成的说明。该模型还可以与 LM Studio 和 Jan 等本地应用程序以及 Google Colab 和 Kaggle 等云平台一起使用。