研究人员开发了MinerU-Popo,一个旨在通过解决当前基于VLM的光学字符识别(OCR)模型的局限性来增强结构化文档解析的新型框架。该系统专注于重建文档级别的逻辑结构,例如跨页边界经常被分割的段落和表格。通过采用在自定义数据集上微调的轻量级后处理模型,并利用长文档的动态分块,MinerU-Popo显著提高了RAG应用的准确性并降低了延迟。 AI
影响 增强了AI系统的文档理解能力,可能提高RAG的准确性和效率。
排序理由 发表了一篇详细介绍新文档解析方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →