English(EN) DisciplineGen-1M: A Large-Scale Dataset for Multidisciplinary Visual Generation and Editing

新数据集DisciplineGen-1M助力学术内容的AI视觉生成

作者 PulseAugur 编辑部 · [2 个来源] · 2026-07-02 15:07

研究人员推出了DisciplineGen-1M，这是一个大规模数据集，旨在提高AI模型在生成和编辑知识密集型视觉内容方面的准确性。该数据集包含跨越数学、物理和计算机科学等十个学科的120万个样本，并通过结合矢量图形渲染、基于OCR的编辑和程序化合成的框架构建而成。使用该数据集进行的实验在GenExam和GRADE等特定学科的基准测试中显示出显著的改进，这表明结构化的学术视觉数据对于推动AI能力超越美学吸引力，实现可验证的、基于知识的视觉创作至关重要。 AI

影响增强AI在跨学术学科生成和编辑准确的、基于知识的视觉内容的能力。

排序理由该项目是一篇介绍新数据集和模型的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

arXiv cs.CV TIER_1 English(EN) · Zhaokai Wang, Mingxin Liu, Zirun Zhu, Ziqian Fan, Yiguo He, Mohan Zhang, Leyao Gu, Xiangyu Zhao, Ning Liao, Shaofeng Zhang, Xuanhe Zhou, Zhihang Zhong, Junchi Yan, Xue Yang · 2026-07-03 04:00

DisciplineGen-1M: A Large-Scale Dataset for Multidisciplinary Visual Generation and Editing

arXiv:2607.02290v1 Announce Type: new Abstract: Recent image generation and editing models can produce visually appealing natural images, yet they remain unreliable when the target image is a knowledge-intensive diagram whose correctness depends on disciplinary concepts, symbolic…
arXiv cs.CV TIER_1 English(EN) · Xue Yang · 2026-07-02 15:07

DisciplineGen-1M: A Large-Scale Dataset for Multidisciplinary Visual Generation and Editing

Recent image generation and editing models can produce visually appealing natural images, yet they remain unreliable when the target image is a knowledge-intensive diagram whose correctness depends on disciplinary concepts, symbolic structure, and precise spatial relations. We in…

报道来源 [2]

DisciplineGen-1M: A Large-Scale Dataset for Multidisciplinary Visual Generation and Editing

DisciplineGen-1M: A Large-Scale Dataset for Multidisciplinary Visual Generation and Editing

相关实体

相关话题