PulseAugur
实时 19:17:59
English(EN) Malaysian English News Decoded: A Linguistic Resource for Named Entity and Relation Extraction

新数据集提升马来西亚英语的自然语言处理能力

研究人员开发了一个名为马来西亚英语新闻(MEN)数据集的新数据集,其中包含200篇标注了实体和关系的新闻文章。该资源旨在改进针对马来西亚英语的自然语言处理(NLP)任务,马来西亚英语与标准英语不同,并对现有的NLP模型提出了挑战。实验表明,使用此定制数据集对spaCy NER工具进行微调,显著提高了其在马来西亚英语新闻上的性能。 AI

影响 能够提高马来西亚英语的NLP性能,促进该地区的研发和应用。

排序理由 该集群包含一篇学术论文,详细介绍了为特定NLP任务创建和验证新数据集的过程。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新数据集提升马来西亚英语的自然语言处理能力

报道来源 [1]

  1. arXiv cs.CL TIER_1 English(EN) · Mohan Raj Chanthran, Lay-Ki Soon, Huey Fang Ong, Bhawani Selvaretnam ·

    马来西亚英语新闻解码:命名实体与关系抽取语言学资源

    arXiv:2402.14521v2 Announce Type: replace Abstract: Standard English and Malaysian English exhibit notable differences, posing challenges for natural language processing (NLP) tasks on Malaysian English. Unfortunately, most of the existing datasets are mainly based on standard En…