一位开发者已成功将 NVIDIA 的 Parakeet 语音转文本模型移植到 ggml 框架,使其能够在没有 Python 或 PyTorch 的情况下高效地在 CPU 和 GPU 上运行。此移植实现了与 NVIDIA 的 NeMo 模型逐字节相同的输出,在 GPU 上速度提升高达 5 倍,在 CPU 上速度提升 1.86 倍,同时还减少了内存使用。量化的 GGUF 版本已可用,该项目包含一个 C-API 以实现广泛集成,甚至通过 LocalAI 为本地兼容 OpenAI 的转录端点提供支持。 AI
影响 实现了更广泛、更高效的本地部署先进语音转文本功能。
排序理由 将现有模型移植到新框架以提高性能和可访问性。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →