PulseAugur
实时 00:47:02
实体 DocAtlas

DocAtlas

PulseAugur coverage of DocAtlas — every cluster mentioning DocAtlas across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
情绪 · 30 天

2 天有情绪数据

最近 · 第 1/1 页 · 共 2 条
  1. TOOL · CL_44830 ·

    DocAtlas框架提升低资源语言的多语言文档理解能力

    研究人员推出DocAtlas,一个旨在改进多语言文档理解的新颖框架,尤其针对低资源语言。该系统使用DOCX和合成LaTeX生成的双管道,构建了82种语言的高保真OCR数据集和基准。对16个最先进模型的评估突显了低资源脚本中持续存在的性能差距,但DocAtlas证明,直接偏好优化(DPO)结合渲染得出的地面真实数据,可以稳定地进行多语言模型适配,在不降低基础语言性能的情况下提高准确性。

  2. TOOL · CL_34516 ·

    DocAtlas framework boosts multilingual document understanding across 82 languages

    Researchers have developed DocAtlas, a new framework designed to improve multilingual document understanding, particularly for low-resource languages. This system constructs high-fidelity OCR datasets and benchmarks acr…