English(EN) OmniGen-AR: AutoRegressive Any-to-Image Generation

OmniGen-AR框架支持从多种输入进行通用图像生成

作者 PulseAugur 编辑部 · [2 个来源] · 2026-06-08 07:47

研究人员推出了一种新颖的自回归框架OmniGen-AR，用于通用图像生成。该统一模型可以从多种输入合成图像，包括文本、分割图、深度信息，甚至用于编辑或视频预测的现有图像。为防止条件令牌影响内容令牌，该框架采用了分离因果注意力（DCA）技术，该技术在训练期间分离注意力机制。OmniGen-AR在GenEval和VBench等基准测试中展示了最先进的性能。 AI

影响引入了一个统一的多模态图像生成框架，有望简化复杂的视觉合成任务。

排序理由这是一篇描述新模型和方法的论文。

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

arXiv cs.CV TIER_1 English(EN) · Junke Wang, Xun Wang, Qiushan Guo, Peize Sun, Weilin Huang, Zuxuan Wu, Yu-Gang Jiang · 2026-06-09 04:00

OmniGen-AR: 自动回归式任意图像生成

arXiv:2606.09156v1 Announce Type: new Abstract: Autoregressive (AR) models have demonstrated strong potential in visual generation, offering superior performance with simple architectures and optimization objectives. However, existing methods are typically limited to single-modal…
arXiv cs.CV TIER_1 English(EN) · Yu-Gang Jiang · 2026-06-08 07:47

OmniGen-AR：自回归任意图像生成

Autoregressive (AR) models have demonstrated strong potential in visual generation, offering superior performance with simple architectures and optimization objectives. However, existing methods are typically limited to single-modality conditions, e.g., text, restricting their ap…

报道来源 [2]

OmniGen-AR: 自动回归式任意图像生成

OmniGen-AR：自回归任意图像生成

相关实体

相关话题