研究人员开发了一个名为 CCPoetry-49K 的新数据集,其中包含超过 49,000 条专门用于古诗分析的指令-响应对。然后,他们使用 LoRA 微调了 Qwen2.5-14B 模型,创建了 PoetryQwen,一个领域专业的 LLM。该专业模型在 CCL25-Eval Task 5 基准测试中取得了 0.757 的分数,比基线 Qwen2.5-14B-Instruct 提高了 9.7%,并展示了在古诗精确翻译和情感理解方面的能力提升。 AI
影响 这项工作引入了一个专门针对古诗的特定数据集和模型,有望提高 LLM 在小众文化和语言领域的性能。
排序理由 该集群包含一篇研究论文,详细介绍了用于特定任务的新数据集和微调模型。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →