Datalab 推出了 lift,一个 9B 参数的开放权重视觉模型,专为从 PDF 和图像中提取结构化数据而设计。该模型以 JSON 模式作为输入,并生成符合该模式的 JSON 对象,在基准数据集上实现了 90.2% 的字段准确率。lift 可一次性处理整个多页文档,并提供模式约束解码,以确保输出的结构有效性。 AI
影响 该模型可以通过提供一个可自托管的开源解决方案,将非结构化文档数据转换为结构化 JSON,从而简化企业的 数据提取工作流程。
排序理由 一项新的开放权重模型的研发发布,并附有性能指标。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →