PulseAugur
实时 14:16:56
Deutsch(DE) Tiny LLM Benchmark: Jetson Orin Nano Super 8GB - Four Power Modes × Eight Models

Jetson Orin Nano 在不同功耗模式下对8个微型LLM进行基准测试

在Jetson Orin Nano Super 8GB设备上对八个小型语言模型(1.35亿至约10亿参数)进行了基准测试。测试使用了llama.cpp CUDA后端,探索了四种功耗模式(7W、15W、25W、MAXN)。研究结果表明,25W功耗模式在所有测试模型中提供了性能和效率的最佳平衡,在每焦耳生成的令牌数量方面优于15W和MAXN模式。 AI

影响 确定了在边缘设备上运行小型LLM的最佳功耗效率,为硬件和软件配置提供指导。

排序理由 在特定硬件上对多个小型LLM进行基准测试。[lever_c_demoted from research: ic=1 ai=0.7]

在 r/LocalLLaMA 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

Jetson Orin Nano 在不同功耗模式下对8个微型LLM进行基准测试

报道来源 [1]

  1. r/LocalLLaMA TIER_1 Deutsch(DE) · /u/East-Muffin-6472 ·

    Tiny LLM Benchmark: Jetson Orin Nano Super 8GB - Four Power Modes × Eight Models

    <table> <tr><td> <a href="https://www.reddit.com/r/LocalLLaMA/comments/1tuq5j1/tiny_llm_benchmark_jetson_orin_nano_super_8gb/"> <img alt="Tiny LLM Benchmark: Jetson Orin Nano Super 8GB - Four Power Modes × Eight Models" src="https://preview.redd.it/xy1e7dxe8v4h1.png?width=140&amp…