PulseAugur
实时 14:37:25
English(EN) A Robust Deep Learning Framework for Bangla License Plate Recognition Using YOLO and Vision-Language OCR

强大的深度学习框架可识别孟加拉语车牌

研究人员开发了一个强大的深度学习框架,用于识别孟加拉语车牌,集成了对象检测和光学字符识别。该系统利用基于 YOLOv8 的新颖的两阶段自适应训练策略进行车牌定位,准确率达到 97.83%,IoU 达到 91.3%。对于文本提取,采用基于 ViT + BanglaBERT 模型的 Vision-Language OCR 方法,字符错误率(CER)为 0.1323,单词错误率(WER)为 0.1068。该框架在各种环境条件下表现出一致的性能,适用于智能交通应用。 AI

影响 增强了对特殊字符集的 OCR 能力,可能改进了自动交通管理系统。

排序理由 详细介绍用于特定计算机视觉任务的新深度学习框架的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Nayeb Hasin, Md. Arafath Rahman Nishat, Mainul Islam, Khandakar Shakib Al Hasan, Asif Newaz ·

    A Robust Deep Learning Framework for Bangla License Plate Recognition Using YOLO and Vision-Language OCR

    arXiv:2603.10267v2 Announce Type: replace Abstract: An Automatic License Plate Recognition (ALPR) system constitutes a crucial element in an intelligent traffic management system. However, the detection of Bangla license plates remains challenging because of the complicated chara…