PulseAugur
实时 07:39:45
English(EN) I Built a Drop-In Ollama Replacement in Pure C# - No llama.cpp, No Native Binaries, Just ILGPU Kernels

开发者创建 C# 原生 Ollama 替代品用于 LLM 推理

一位开发者使用 SpawnDev.ILGPU.ML 完全用 C# 创建了一个新的大型语言模型 (LLM) 推理服务器。该服务器旨在成为 Ollama 的即插即用替代品,支持 Ollama 的 API 并直接从 Ollama 缓存读取模型,无需重新下载。虽然仍处于早期开发阶段,但其交互式聊天性能与 Ollama 相当,令牌生成速度接近成熟的 llama.cpp 后端。该项目旨在提供一个完全 C# 原生的解决方案来运行 LLM,包括分词器、量化和注意力机制,并使用从 C# 转译的 GPU 内核。 AI

影响 为本地 LLM 推理提供了 C# 原生替代方案,可能简化 .NET 开发者的集成。

排序理由 这是一个与现有 LLM 基础设施集成的第三方工具,而不是来自前沿实验室的直接发布。

在 dev.to — LLM tag 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

开发者创建 C# 原生 Ollama 替代品用于 LLM 推理

报道来源 [1]

  1. dev.to — LLM tag TIER_1 English(EN) · Todd Tanner ·

    我用纯 C# 构建了一个即插即用的 Ollama 替代品 - 无 llama.cpp,无原生二进制文件,只有 ILGPU 内核

    <p>A month ago I <a href="https://dev.to/lostbeard/i-built-a-neural-network-engine-in-c-that-runs-in-your-browser-no-onnx-runtime-no-javascript-4aj3">shipped a neural network engine written entirely in C#</a> - six GPU backends, no ONNX Runtime, no JavaScript bridge, no native bi…