一项关于 Setswana 语推文情感分析的新研究表明,标注质量会随着时间的推移而显著下降,与在一分钟内标注的推文相比,相隔数天标注的推文的标注者间一致性会大幅下降。研究发现,时间同步性是比标注速度或语言特征更强的预测因素。该研究还评估了几种语言模型,发现 GPT-5 在少样本情感分类中取得了最高的宏 F1 分数。 AI
影响 强调了在 NLP 任务中保持标注质量的挑战,并对 LLM 在情感分析方面的表现进行了基准测试。
排序理由 该集群包含一篇详细介绍标注质量和模型性能研究结果的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
在 Hugging Face Daily Papers 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →