研究人员推出了两个新语料库 Hlava Cor 和 Hlava AD,旨在研究核心指代和语篇关系中人类标注的变异。Hlava Cor 包含 1,024 个由三名个体标注的语境,侧重于跨不同语言元素的指代识别。Hlava AD 包含 512 个由五名个体标注的语境,侧重于语篇关系。两个语料库的标注者间一致性(inter-annotator agreement)均约为 60-65%,在自动指代消解模型也难以处理的情况下,一致性较低,这表明了人类标注者也面临歧义。 AI
影响 强调了自然语言理解任务中的挑战,可能指导未来核心指代和语篇模型的开发。
排序理由 该集群包含一篇研究论文,详细介绍了用于研究语言标注变异的新语料库。
- arXiv
- Czech
- Hlava Cor
- Hugging Face
- alphaXiv
- CatalyzeX
- CORE Recommender
- DagsHub
- Gotit.pub
- ScienceCast
AI 生成摘要 · Google Gemini · 来自 3 个来源。 我们如何撰写摘要 →