PulseAugur
实时 15:06:50
English(EN) 1-bit and 1.58 bit LLM Benchmarking on Jetson Orin Nano Super | Bonsai LM

Bonsai LM 模型在 Jetson Orin Nano Super 上进行基准测试

最近的一项基准测试在 Jetson Orin Nano Super 上测试了 Bonsai LM 的 1 位和 1.58 位模型,参数范围从 1.7B 到 8B。测试使用 llama.cpp CUDA,重点关注不同功耗模式(7W、15W、25W、MAXN)下的性能。主要发现表明,对于高达 4B 参数的模型,25W 是能效最优选择,而对于 8B 模型,15W 是更节能的选择。未观察到热节流,峰值温度远低于硬件限制。 AI

影响 为在边缘设备上高效部署 LLM 提供了见解,告知操作员有关性能权衡的信息。

排序理由 这是在特定硬件上对现有模型的基准测试,并非新模型发布或重大的行业事件。[lever_c_demoted from research: ic=1 ai=0.7]

在 r/LocalLLaMA 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

Bonsai LM 模型在 Jetson Orin Nano Super 上进行基准测试

报道来源 [1]

  1. r/LocalLLaMA TIER_1 English(EN) · /u/East-Muffin-6472 ·

    1-bit and 1.58 bit LLM Benchmarking on Jetson Orin Nano Super | Bonsai LM

    <table> <tr><td> <a href="https://www.reddit.com/r/LocalLLaMA/comments/1u21lhp/1bit_and_158_bit_llm_benchmarking_on_jetson_orin/"> <img alt="1-bit and 1.58 bit LLM Benchmarking on Jetson Orin Nano Super | Bonsai LM" src="https://preview.redd.it/od5qauy6eg6h1.png?width=140&amp;hei…