English(EN) Temporal Simultaneity Predicts Annotation Quality in Sentiment Corpora

标注质量随时间下降，GPT-5 在情感分类方面领先

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-26 16:21

一项关于 Setswana 语推文情感分析的新研究表明，标注质量会随着时间的推移而显著下降，与在一分钟内标注的推文相比，相隔数天标注的推文的标注者间一致性会大幅下降。研究发现，时间同步性是比标注速度或语言特征更强的预测因素。该研究还评估了几种语言模型，发现 GPT-5 在少样本情感分类中取得了最高的宏 F1 分数。 AI

影响强调了在 NLP 任务中保持标注质量的挑战，并对 LLM 在情感分析方面的表现进行了基准测试。

排序理由该集群包含一篇详细介绍标注质量和模型性能研究结果的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 Hugging Face Daily Papers 阅读 →

Gemini
GPT-5

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

Hugging Face Daily Papers TIER_1 English(EN) · 2026-05-26 16:21

时间同步性预测情感语料库中的标注质量

Annotation quality is difficult to sustain when campaigns span weeks or months with small annotator pools. We present a Setswana sentiment dataset of 3,565 tweets annotated by three native-speaker annotators across eight batches and examine why inter-annotator agreement (IAA) dec…

报道来源 [1]

时间同步性预测情感语料库中的标注质量

相关实体

相关话题