百度文心发布了其开源OCR工具的新版本PaddleOCR-VL-1.6。此次更新在OmniDocBench v1.6基准测试中实现了超过96.33%的准确率,超越了Gemini-3-Pro和GPT-5.2等主流模型。该模型在理解扫描件、弯曲文档和屏幕截图等复杂文档方面表现出显著的改进,使其成为文档数字化的领先解决方案。 AI
影响 在文档解析基准测试中设定了新的SOTA,可能加速企业采用先进OCR解决方案。
排序理由 一家主要科技公司发布了专门OCR模型的最新版本,在行业基准测试中取得了最先进的成果。[lever_c_demoted from frontier_release: ic=1 ai=1.0]
- Baidu
- Gemini-3-Pro
- GLM-OCR
- GPT-5.2
- MinerU-2.5-Pro
- OmniDocBench v1.6
- PaddleOCR-VL-1.5
- PaddleOCR-VL-1.6
- Real5-OmniDocBench
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →