研究人员开发了一个多阶段抽取框架,旨在提高从长篇、扫描的金融文档中抽取结构化信息的准确性。该管道集成了图像预处理、OCR、页面级检索以及基于视觉语言模型(VLM)的抽取,将页面定位与多模态推理分开。该框架在120份生产级KYC文档上进行了测试,取得了显著的改进,最佳配置的准确率达到了87.27%,比直接应用VLM高出31.9个百分点。 AI
影响 增强了从复杂金融文档中抽取结构化数据的能力,有望简化合规和KYC工作流。
排序理由 学术论文,详细介绍了从金融文档中抽取信息的新框架。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →