PulseAugur
实时 03:06:10
English(EN) Structure-Preserving Document Translation via Multi-Stage LLM Pipeline: A Case Study in Marathi

LLM管道在马拉地语到英语翻译中保留文档结构

研究人员开发了一个新颖的框架,用于将政府文件从马拉地语翻译成英语,特别解决了保留文档结构和格式的挑战。该系统集成了布局感知OCR、基于坐标的文本提取和大型语言模型,以确保翻译后的文档保持其原始布局和层次结构元素。在真实的马拉地语政府PDF上进行的评估表明,与仅文本的翻译方法相比,这种方法显著提高了结构保留、翻译连贯性和术语一致性,旨在提高电子政务中的多语言可访问性。 AI

影响 增强了政府文件跨语言的可访问性,可能简化行政流程和政策分析。

排序理由 详细介绍文档翻译新颖技术方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

LLM管道在马拉地语到英语翻译中保留文档结构

报道来源 [1]

  1. arXiv cs.CL TIER_1 English(EN) · Manasi Waghe, Danish Chandargi, Mohammad Aamir Rayyan, Raviraj Joshi, A. R. Deshpande ·

    通过多阶段LLM管道实现结构保持的文档翻译:以马拉地语为例

    arXiv:2606.28796v1 Announce Type: new Abstract: Government documents in India are predominantly issued in regional languages such as Marathi, creating substantial accessibility barriers for non-native readers, interstate administrative bodies, and policy analysts. Although recent…