研究人员开发了一个强大的深度学习框架,用于识别孟加拉语车牌,集成了对象检测和光学字符识别。该系统利用基于 YOLOv8 的新颖的两阶段自适应训练策略进行车牌定位,准确率达到 97.83%,IoU 达到 91.3%。对于文本提取,采用基于 ViT + BanglaBERT 模型的 Vision-Language OCR 方法,字符错误率(CER)为 0.1323,单词错误率(WER)为 0.1068。该框架在各种环境条件下表现出一致的性能,适用于智能交通应用。 AI
影响 增强了对特殊字符集的 OCR 能力,可能改进了自动交通管理系统。
排序理由 详细介绍用于特定计算机视觉任务的新深度学习框架的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →