Oracle Noise 框架通过更快的语义对齐来增强文本到图像模型

作者 PulseAugur 编辑部 · [1 个来源] · 2026-04-28 04:00

研究人员推出了一种名为 Oracle Noise 的新颖框架，旨在通过优化初始噪声输入来改进文本到图像扩散模型。该方法将噪声初始化重构为受语义驱动的、约束在超球体内的优化过程，从而防止范数膨胀并保留高斯先验。Oracle Noise 可有效识别提示中的关键结构词，以引导优化能量，从而在不依赖外部代理模型的情况下实现更快的收敛和更高的图像质量。实验表明，在 2 秒的优化窗口内，人类偏好、语义对齐和样本多样性均得到显著改善。 AI

影响通过优化噪声初始化来提高文本到图像生成的速度和质量，可能影响创意 AI 工具。

排序理由这是一篇详细介绍改进文本到图像扩散模型新方法的学术论文。

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Haosen Li, Wenshuo Chen, Lei Wang, Shaofeng Liang, Haozhe Jia, Yutao Yue · 2026-04-28 04:00

Oracle Noise：面向可解释潜在优化的更快的语义球面对齐

arXiv:2604.23540v1 Announce Type: new Abstract: Text-to-image diffusion models have achieved remarkable generative capabilities, yet accurately aligning complex textual prompts with synthesized layouts remains an ongoing challenge. In these models, the initial Gaussian noise acts…

报道来源 [1]

Oracle Noise：面向可解释潜在优化的更快的语义球面对齐

相关实体

相关话题