PulseAugur
实时 19:52:51

新流程为古希腊议会文本创建自然语言处理资源

研究人员开发了一个新的、可复现的流程,用于为古希腊语议会文本创建类似通用依存关系的解析资源。该工作流程解决了当前自然语言处理工具在处理古希腊历史文献方面的局限性,整合了光学字符识别(OCR)重建、大型语言模型(LLM)辅助标注和自动化验证。由此产生的数据集和方法旨在使历史议会档案更容易用于自然语言处理研究。 AI

影响 能够更好地对古希腊议会历史文献进行自然语言处理分析,可能为语言学和历史学研究开辟新途径。

排序理由 该集群包含一篇学术论文,详细介绍了用于历史希腊文本自然语言处理任务的新方法和数据集。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

报道来源 [2]

  1. arXiv cs.CL TIER_1 · George Mikros, Fotios Fitsilis ·

    A Reproducible Universal Dependencies-Style Pipeline for Katharevousa Greek Parliamentary Text

    arXiv:2605.22978v1 Announce Type: new Abstract: Katharevousa Greek remains poorly served by contemporary NLP pipelines despite its importance for legal, administrative, and parliamentary archives. We present a reproducible workflow for building and evaluating a Universal Dependen…

  2. arXiv cs.CL TIER_1 · Fotios Fitsilis ·

    A Reproducible Universal Dependencies-Style Pipeline for Katharevousa Greek Parliamentary Text

    Katharevousa Greek remains poorly served by contemporary NLP pipelines despite its importance for legal, administrative, and parliamentary archives. We present a reproducible workflow for building and evaluating a Universal Dependencies-style parsing resource for Katharevousa par…