English(EN) I Tried to Voice-Clone Myself in 90 MB

开发者将 LLM 与 n-gram 结合以实现个性化语音克隆

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-07 03:40

一位开发者尝试通过将小型语言模型 (SmolLM2) 与基于其已发表作品训练的 token 级 n-gram 相结合来进行语音克隆。目标是创建一个听起来像该开发者的聊天机器人，但结果喜忧参半。虽然 n-gram 增加了个人的语言风格，但语言模型难以掌握其底层概念，导致输出在语法上正确但在概念上空洞或偏执。 AI

影响这项实验探索了通过将统计 n-gram 与生成模型相结合来个性化 LLM 输出的新方法，可能影响未来定制 AI 语音的方法。

排序理由该集群描述了一个结合现有模型和技术以实现特定结果的实验，属于研究范畴。[lever_c_demoted from research: ic=1 ai=1.0]

在 dev.to — LLM tag 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

dev.to — LLM tag TIER_1 English(EN) · Alex Towell · 2026-06-07 03:40

我尝试用 90MB 的数据克隆了自己的声音

<p>The experiment: a tiny SmolLM2 running in your browser. A token-level n-gram trained on every word I have published. Mix the two distributions in probability space at every generation step. Sample from the mix.</p> <p>You can try it at <a href="https://metafunctor.com/ask/" re…

报道来源 [1]

我尝试用 90MB 的数据克隆了自己的声音

相关实体

相关话题