一个团队已成功将 Qwen3-4B-Instruct-2507 大型语言模型微调,使其能够使用卡拉恰伊-巴尔卡尔语进行交流。这包括开发自定义形态处理器以增强方言,从头开始训练分词器,以及平衡模型在原始数据上的训练以保留指令遵循能力。生成的模型名为 QM-4B,可在 HuggingFace 上找到,并在 TurkLang 2026 会议上进行了展示。 AI
影响 为低资源语言启用人工智能能力,可能有助于保护语言多样性。
排序理由 针对低资源语言对特定 LLM 进行微调。[lever_c_demoted from research: ic=1 ai=1.0]
在 Mastodon — fosstodon.org 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →