研究人员调查了上下文学习在土耳其成语轻动词结构(LVCs)分类中的有效性。他们将监督式BERTurk基线与使用零样本、单样本和少样本提示的指令微调大型语言模型(LLMs)进行了比较。虽然LLMs在零样本LVC召回率方面遇到困难,但精心设计的演示的少样本提示提高了性能,其中GPT-OSS-20B和Qwen 2.5-14B表现出稳健的结果,与监督基线相当或超过了它。 AI
影响 证明了提示工程如何显著影响LLMs在细微语言任务上的性能,从而影响模型在专业NLP应用中的部署方式。
排序理由 学术论文,详细介绍了对LLM在特定语言任务上性能的新评估。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →