HexGrid Cloud 提供在用户指定的 GPU 和配置上对开放权重 LLM 进行基准测试的服务。他们正在征集模型和硬件设置的建议,以测试其部署平台,重点关注适合单个 H200 GPU 内存的聊天/指令模型。测试结果将包括吞吐量、延迟和成本指标,并将与完整的配置细节一起公开分享,以确保可复现性。 AI
影响 为用户提供了一种在所需硬件上测试特定开放权重 LLM 的方法,有助于部署决策。
排序理由 这是平台提供商的服务产品,而非核心 AI 发布或研究。
- Devstral-Small-2-24B-Instruct-2512
- Gemma-4 31B
- graphics processing unit
- H200
- HexGrid Cloud
- L40S
- Llama 3.3 70B Instruct
- Nemotron-3 Nano 30B A3B
- Nemotron-3 Super 120B-A12B
- RTX PRO 6000
- Qwen-3.6 27B
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →