PulseAugur
实时 16:55:42
English(EN) Multilingual and Cross-Lingual Citation Needed Detection on Wikipedia for Lower-Resource Languages

小型语言模型在多语言引用检测中优于大型语言模型

研究人员开发了一个新的多语言语料库MCN,以解决维基百科上低资源语言的引用需求检测(CND)问题。他们的研究表明,经过编码器式目标微调的小型语言模型(SLM)在此任务上的表现优于大型语言模型(LLM)。值得注意的是,仅在英语数据上训练的SLM表现出强大的跨语言性能,这表明在资源受限的环境中,紧凑型、专用模型比LLM更适合CND。 AI

影响 为低资源语言社区提供了一种更易于访问和有效的核查方法,有可能提高维基百科等平台上的信息质量。

排序理由 该集群包含一篇详细介绍新语料库和语言模型实验结果的学术论文。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

小型语言模型在多语言引用检测中优于大型语言模型

报道来源 [2]

  1. arXiv cs.CL TIER_1 English(EN) · Gerrit Quaremba, Amy Rechkemmer, Elizabeth Black, Denny Vrande\v{c}i\'c, Elena Simperl ·

    维基百科上针对低资源语言的多语言和跨语言引用需求检测

    arXiv:2605.31136v1 Announce Type: new Abstract: In automated fact-checking (AFC), check-worthiness detection identifies claims requiring verification based on domain-specific criteria. On Wikipedia, this task instantiates as Citation Needed Detection (CND), which flags claims lac…

  2. arXiv cs.CL TIER_1 English(EN) · Elena Simperl ·

    维基百科上针对低资源语言的多语言和跨语言引用需求检测

    In automated fact-checking (AFC), check-worthiness detection identifies claims requiring verification based on domain-specific criteria. On Wikipedia, this task instantiates as Citation Needed Detection (CND), which flags claims lacking supporting citations. However, existing res…