English(EN) Data Language Models: A New Foundation Model Class for Tabular Data

数据语言模型提供原生表格数据理解，性能超越现有方法

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-08 04:00

研究人员推出数据语言模型（DLM），这是一类新的基础模型，旨在原生理解表格数据，无需预处理。首个DLM Schema-1，一个拥有1.4亿参数、在超过230万个数据集上训练的模型，在行级预测基准测试中表现优于现有方法。Schema-1在缺失值重建方面也表现出色，并且仅凭原始单元格值就能识别行业领域，表明其对表格数据的结构理解比通用语言模型更深入。 AI

影响为表格数据建立了一个新的基础模型类别，有可能简化数据密集型行业的AI开发和决策制定。

排序理由在学术论文中为表格数据引入了一个新的基础模型类别。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Eda Erol, Giuliano Pezzoli, Ozer Cem Kelahmet · 2026-05-08 04:00

数据语言模型：表格数据的新基础模型类别

arXiv:2605.06290v1 Announce Type: new Abstract: Every major data modality now has a foundation model that understands it natively: text has language models, images have vision models, audio has audio models. Tabular data, the modality on which many consequential real-world AI dec…

报道来源 [1]

数据语言模型：表格数据的新基础模型类别

相关实体

相关话题