研究人员开发了一个新颖的框架,用于将政府文件从马拉地语翻译成英语,特别解决了保留文档结构和格式的挑战。该系统集成了布局感知OCR、基于坐标的文本提取和大型语言模型,以确保翻译后的文档保持其原始布局和层次结构元素。在真实的马拉地语政府PDF上进行的评估表明,与仅文本的翻译方法相比,这种方法显著提高了结构保留、翻译连贯性和术语一致性,旨在提高电子政务中的多语言可访问性。 AI
影响 增强了政府文件跨语言的可访问性,可能简化行政流程和政策分析。
排序理由 详细介绍文档翻译新颖技术方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
- alphaXiv
- arXiv
- CatalyzeX
- Connected Papers
- DagsHub
- E-Governance
- Gotit.pub
- HTML
- Hugging Face
- India
- Litmaps
- LLM
- Marathi
- ScienceCast
- scite Smart Citations
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →