PulseAugur
实时 20:33:44
English(EN) First time fine-tuning, need a sanity check — 3B or 7B for multi-task reasoning? [D]

机器学习初学者就3B与7B模型用于多任务推理微调寻求建议

一位自学成才的个人正在为复杂的、多任务推理项目寻找微调语言模型的建议。用户需要确定一个30亿或70亿参数的模型,例如Phi-4-mini或Qwen 2.5,是否更适合涉及识别潜在问题、持有多种观点以及从噪音中辨别关键信息等任务。他们拥有一个40-60k个示例的数据集,并担心相关推理模式之间可能出现的混淆以及训练此类任务的难度。 AI

影响 为在复杂推理任务上微调小型模型提供指导。

排序理由 用户正在就为特定研究任务微调模型寻求建议。

在 r/MachineLearning 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. r/MachineLearning TIER_1 English(EN) · /u/retarded_770 ·

    First time fine-tuning, need a sanity check — 3B or 7B for multi-task reasoning? [D]

    <!-- SC_OFF --><div class="md"><p>Ok so this is my first post here, been lurking for a while. I’m about to start my first fine-tuning project and I don’t want to commit to the wrong direction so figured I’d ask.</p> <p>Background on me: I’m not from an ML background, self-taught,…