PulseAugur
实时 17:22:42
中文(ZH) 97毫秒!百度 PP-OCRv6 把 OCR 带进毫秒时代

百度PP-OCRv6实现97毫秒推理,引领全球OCR基准

百度文心正式发布全新OCR模型PP-OCRv6,提供Tiny、Small和Medium版本,支持50多种语言,并可部署于浏览器到服务器的各种场景。Tiny模型仅重1.5MB,可在浏览器内实现低至97毫秒的OCR识别,增强了隐私性并降低了部署门槛。PP-OCRv6在OCR性能方面树立了新的基准,在专业OCR任务上超越了主流多模态模型,巩固了PaddleOCR作为领先的开源OCR项目的地位。 AI

影响 为基于浏览器的OCR设定了新的SOTA(State-of-the-Art),可能加速边缘和注重隐私的应用中的AI代理能力。

排序理由 发布新的OCR模型,包含性能基准和部署细节。[lever_c_demoted from frontier_release: ic=1 ai=1.0]

在 雷峰网 (Leiphone) 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

百度PP-OCRv6实现97毫秒推理,引领全球OCR基准

报道来源 [1]

  1. 雷峰网 (Leiphone) TIER_1 中文(ZH) ·

    97 milliseconds! Baidu PP-OCRv6 brings OCR into the millisecond era

    <p>近日,百度文心正式发布新一代OCR模型PP-OCRv6,一次性推出Tiny、Small、Medium三档模型,支持&nbsp;50&nbsp;多种语言,覆盖浏览器端、嵌入式设备到服务器等主流场景。公开结果显示,PP-OCRv6再次刷新OCR领域评测纪录,综合性能位居全球第一。</p><p>其中,PP-OCRv6 Tiny的尺寸仅1.5MB,可直接部署于本地浏览器环境,单图预测最快仅需&nbsp;97&nbsp;毫秒。用户数据无需上传云端即可完成OCR处理,在保障隐私安全的同时,大幅降低部署门槛。有开发者评价,PP-OCRv6可能是全球唯一可在浏览器…