研究人员开发了一种名为LoRDBA的新方法,用于在设备上微调大型语言模型。该技术用二元符号载体替换标准的低秩因子,显著减小了适配器的存储占用空间,同时保持了与全精度LoRA适配器相当的质量。实验表明,LoRDBA引入的延迟开销极小,训练内存使用量适中,使得设备端适配更加高效。 AI
影响 实现了更高效的LLM设备端适配,可能降低本地部署的成本并提高可访问性。
排序理由 该集群包含一篇详细介绍LLM微调新颖方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →