一篇新的研究论文探讨了使用指令微调的大型语言模型(LLMs)对失语症话语中的正确信息单元(CIUs)进行分类。研究发现,虽然零样本提示不足,但少样本提示显著提高了 Llama 3.1:8b、qwen2.5:7b 和 mistral:7b 等模型的性能,取得了与人类标注者相当的结果。然而,大型语言模型显示出高召回率但较低的精确率,表明它们倾向于过度分类代币为 CIUs,并且性能随失语症的严重程度而变化。 AI
影响 大型语言模型提示显示出在失语症评估中自动识别 CIUs 的潜力,提供了一种人工辅助的解决方案。
排序理由 一篇发表在 arXiv 上的研究论文,详细介绍了大型语言模型在特定语言任务上的表现。[lever_c_demoted from research: ic=1 ai=1.0]
- aphasia
- Cat Rescue
- Cohen's kappa
- Correct Information Units
- Llama 3.1:8b
- mistral:7b
- Nicholas and Brookshire
- Phi-3 Mini
- qwen2.5:7b
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →