English(EN) Finally finished my LLM server: EPYC 9575F, 4× RTX 3090 (96GB VRAM), 768GB ECC RAM

用户使用EPYC CPU和4块RTX 3090 GPU构建定制LLM服务器

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-05 03:49

一位用户完成了强大的定制服务器的组装，该服务器专为运行大型语言模型（LLM）而设计。该配置包括AMD EPYC 9575F处理器、768GB内存以及四块NVIDIA RTX 3090 GPU，总计96GB显存。该服务器旨在通过vLLM等工具运行小型模型，以及使用llama.cpp运行大型模型进行高吞吐量推理，并计划应用于AI驱动的NPC规划的空间模拟中。 AI

影响为高级个人项目实现本地、高性能的LLM推理。

排序理由用户自建用于AI推理的硬件，并非新产品发布或研究。

在 r/LocalLLaMA 阅读 →

基础设施

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

r/LocalLLaMA TIER_1 English(EN) · /u/C0smo777 · 2026-06-05 03:49

终于完成了我的LLM服务器：EPYC 9575F，4× RTX 3090（96GB显存），768GB ECC RAM

<table> <tr><td> <a href="https://www.reddit.com/r/LocalLLaMA/comments/1tx9tf2/finally_finished_my_llm_server_epyc_9575f_4_rtx/"> <img alt="Finally finished my LLM server: EPYC 9575F, 4× RTX 3090 (96GB VRAM), 768GB ECC RAM" src="https://preview.redd.it/p34jv9ioyd5h1.jpg?width=140…

报道来源 [1]

终于完成了我的LLM服务器：EPYC 9575F，4× RTX 3090（96GB显存），768GB ECC RAM

相关实体

相关话题