一位 r/LocalLLaMA 子版块的用户对 whisper.cpp(一个本地语音转文本模型)的性能表示失望。尽管使用了 ggml-large-v3 模型,用户在转录约 20 分钟后仍遇到持续的幻觉和重复句子。他们正在寻求有关潜在解决方案或变通方法的建议,例如分割音频文件。 AI
影响 用户报告表明本地语音转文本模型可能存在问题,暗示需要进一步开发或优化。
排序理由 用户对特定软件性能的反馈。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →
一位 r/LocalLLaMA 子版块的用户对 whisper.cpp(一个本地语音转文本模型)的性能表示失望。尽管使用了 ggml-large-v3 模型,用户在转录约 20 分钟后仍遇到持续的幻觉和重复句子。他们正在寻求有关潜在解决方案或变通方法的建议,例如分割音频文件。 AI
影响 用户报告表明本地语音转文本模型可能存在问题,暗示需要进一步开发或优化。
排序理由 用户对特定软件性能的反馈。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →
<!-- SC_OFF --><div class="md"><p>Hi, I'm running whisper.cpp with the best model I could find (ggml-large-v3) but after about 20 min of transcription it hallucinates a sentence that it will repeat endlessly until the end.</p> <p>Is there something I'm missing or should I cut my …