PulseAugur
实时 06:58:42
English(EN) I Tried to Voice-Clone Myself in 90 MB

开发者将 LLM 与 n-gram 结合以实现个性化语音克隆

一位开发者尝试通过将小型语言模型 (SmolLM2) 与基于其已发表作品训练的 token 级 n-gram 相结合来进行语音克隆。目标是创建一个听起来像该开发者的聊天机器人,但结果喜忧参半。虽然 n-gram 增加了个人的语言风格,但语言模型难以掌握其底层概念,导致输出在语法上正确但在概念上空洞或偏执。 AI

影响 这项实验探索了通过将统计 n-gram 与生成模型相结合来个性化 LLM 输出的新方法,可能影响未来定制 AI 语音的方法。

排序理由 该集群描述了一个结合现有模型和技术以实现特定结果的实验,属于研究范畴。[lever_c_demoted from research: ic=1 ai=1.0]

在 dev.to — LLM tag 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. dev.to — LLM tag TIER_1 English(EN) · Alex Towell ·

    我尝试用 90MB 的数据克隆了自己的声音

    <p>The experiment: a tiny SmolLM2 running in your browser. A token-level n-gram trained on every word I have published. Mix the two distributions in probability space at every generation step. Sample from the mix.</p> <p>You can try it at <a href="https://metafunctor.com/ask/" re…