PaddleOCR发布了PP-OCRv6,一套新的轻量级OCR模型,采用统一的MetaFormer风格构建块。PP-OCRv6_medium模型拥有1550万个参数,与前代相比提高了检测和识别准确性。这种新架构设计用于可扩展性,提供从服务器到边缘部署的层级,并支持48种语言,据报道在OCR任务上超越了Qwen3 VL 235B、GPT-5.5和Gemini-3.1-Pro等大型模型。 AI
影响 此次发布提供了一个轻量级、可扩展的OCR解决方案,可与大型模型相媲美,有望提高需要文本识别的应用的效率。
排序理由 该项目描述了一个新的OCR模型发布,包含技术细节和基准比较,符合研究类别。[lever_c_demoted from research: ic=1 ai=1.0]
在 Hugging Face Trending Models 阅读 →
- Gemini-3.1 Pro
- Google Colab
- GPT-5.5
- Kaggle
- LCNetV4
- PaddleOCR
- PaddlePaddle
- PP-OCRv6
- PP-OCRv6_medium_det_safetensors
- PyTorch
- Qwen3 VL 235B
- RepLKFPN
- transformers
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →