研究人员推出了DisciplineGen-1M,这是一个大规模数据集,旨在提高AI模型在生成和编辑知识密集型视觉内容方面的准确性。该数据集包含跨越数学、物理和计算机科学等十个学科的120万个样本,并通过结合矢量图形渲染、基于OCR的编辑和程序化合成的框架构建而成。使用该数据集进行的实验在GenExam和GRADE等特定学科的基准测试中显示出显著的改进,这表明结构化的学术视觉数据对于推动AI能力超越美学吸引力,实现可验证的、基于知识的视觉创作至关重要。 AI
影响 增强AI在跨学术学科生成和编辑准确的、基于知识的视觉内容的能力。
排序理由 该项目是一篇介绍新数据集和模型的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
- alphaXiv
- arXiv
- CatalyzeX
- DagsHub
- DisciplineGen-1M
- GenExam
- Gotit.pub
- GRADE
- Hugging Face
- RISE
- ScienceCast
- WISE
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →