研究人员开发了PRISM,一种新颖的基于扩散模型的文本图像超分辨率框架,可在严重降级的情况下提高可读性。该系统采用流匹配先验校正(FMPR)从不可靠的低质量输入中创建更准确的全局文本引导。此外,结构引导的不确定性感知残差编码器(SURE)通过选择性地整合可靠线索和抑制模糊线索来精炼局部笔画边界。PRISM实现了最先进的性能和快速的推理时间。 AI
影响 引入了一种提高超分辨率图像中文本可读性的新方法,可能有利于OCR和文档分析应用。
排序理由 该集群包含一篇详细介绍文本图像超分辨率新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →