一篇新的arXiv论文研究了大型语言模型(LLM)在主动学习数据标注方面的有效性,特别是在在线评论的敌意检测方面。研究发现,LLM,特别是使用两问界面的GPT-5.2,可以以远低于人类标注者的成本标注数据,并取得相当或更优的性能。然而,研究也指出,在使用LLM标注者时,主动学习并未提供优于随机抽样的可靠优势,且不同LLM的错误结构各不相同,有些会将经济或边境管制言论错误分类。 AI
影响 LLM标注为特定任务提供了比人工标注更具成本效益的替代方案,可能加速AI开发的数据标注。
排序理由 该集群包含一篇详细介绍LLM标注研究结果的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
- active learning
- Ahmad Dawar Hakimi
- arXiv
- German
- GPT-5.2
- Hostility Detection in Online Hindi-English Code-Mixed Conversations
- Hugging Face
- Prolific
- Qwen3.5-122B-10B
- TikTok
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →