PaddleOCR发布PP-OCRv6模型，OCR性能超越大型语言模型

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-09 04:03

PaddleOCR发布了PP-OCRv6，一套新的轻量级OCR模型，采用统一的MetaFormer风格构建块。PP-OCRv6_medium模型拥有1550万个参数，与前代相比提高了检测和识别准确性。这种新架构设计用于可扩展性，提供从服务器到边缘部署的层级，并支持48种语言，据报道在OCR任务上超越了Qwen3 VL 235B、GPT-5.5和Gemini-3.1-Pro等大型模型。 AI

影响此次发布提供了一个轻量级、可扩展的OCR解决方案，可与大型模型相媲美，有望提高需要文本识别的应用的效率。

排序理由该项目描述了一个新的OCR模型发布，包含技术细节和基准比较，符合研究类别。[lever_c_demoted from research: ic=1 ai=1.0]

在 Hugging Face Trending Models 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

Hugging Face Trending Models TIER_1 Dansk(DA) · PaddlePaddle · 2026-06-09 04:03

PaddlePaddle/PP-OCRv6_medium_det_safetensors

image-to-text · 365 downloads · 50 likes

报道来源 [1]

PaddlePaddle/PP-OCRv6_medium_det_safetensors

相关实体

相关话题