English(EN) Locally running mode turns an Image into a Cute Controllable Character you can Play as

新模型将图像变成具有扩展上下文的可控角色

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-28 23:55

一个新模型，是先前迭代的一个8亿参数版本，已被开发出来，可以将图像变成一个可控角色。该模型将上下文窗口增加到12个潜在帧，提高了其前代的稳定性，尽管一致性仍然是一个挑战。该架构与先前版本类似，具有扩展的MLP和使用扩散强制从头开始训练的去噪组件。该模型采用因果扩散方法运行，其中每个帧都经过去噪循环，并添加到KV缓存中，有效地存储了过去的帧。 AI

影响为拥有消费级硬件的用户带来新的交互式内容和角色生成形式。

排序理由该项目描述了AI模型将图像转换为可控角色的特定应用，属于AI工具范畴。

在 r/LocalLLaMA 阅读 →

LocalLLaMA

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

r/LocalLLaMA TIER_1 English(EN) · /u/lucidml_lover · 2026-06-28 23:55

本地运行模式将图像变成可爱的可控角色，让你扮演

<table> <tr><td> <a href="https://www.reddit.com/r/LocalLLaMA/comments/1uicq8x/locally_running_mode_turns_an_image_into_a_cute/"> <img alt="Locally running mode turns an Image into a Cute Controllable Character you can Play as" src="https://external-preview.redd.it/ZmF3NGJ2M2EwNG…

报道来源 [1]

本地运行模式将图像变成可爱的可控角色，让你扮演

相关实体

相关话题