PulseAugur
实时 11:20:16

PaddleOCR-VL-1.6 在文档解析领域创下新的SOTA记录

PaddlePaddle 发布了 PaddleOCR-VL-1.6,这是一款先进的文档解析模型,在包括 OmniDocBench v1.6 在内的多个基准测试中达到了最先进的准确率,得分为 96.33%。新版本采用了一个区域感知数据优化框架和一个渐进式训练后策略,以提高性能,特别是在识别表格、古籍和罕见字符方面。该模型架构与其前身 PaddleOCR-VL-1.5 保持兼容,便于集成。 AI

影响 在文档解析基准测试中创下新的SOTA记录,可能影响企业对先进OCR解决方案的采用。

排序理由 来自重要AI实验室(PaddlePaddle)的模型发布,并附有基准测试结果。[lever_c_demoted from frontier_release: ic=2 ai=1.0]

在 Hugging Face Trending Models 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

PaddleOCR-VL-1.6 在文档解析领域创下新的SOTA记录

报道来源 [2]

  1. Hugging Face Trending Models TIER_1 (CY) · PaddlePaddle ·

    PaddlePaddle/PaddleOCR-VL-1.6

    image-text-to-text · 1 downloads · 54 likes

  2. r/LocalLLaMA TIER_1 (CY) · /u/SarcasticBaka ·

    PaddlePaddle/PaddleOCR-VL-1.6

    <table> <tr><td> <a href="https://www.reddit.com/r/LocalLLaMA/comments/1tq1jpt/paddlepaddlepaddleocrvl16/"> <img alt="PaddlePaddle/PaddleOCR-VL-1.6" src="https://external-preview.redd.it/q2meJGrou1n9m-S5IYUzFX0bAv6yzFwNiKpSfZqSE-8.png?width=640&amp;crop=smart&amp;auto=webp&amp;s=…