研究人员引入了一种名为基于艺术的强化训练(ART)的新方法,用于微调多模态大语言模型(MLLMs)。与修改计算图的LoRA和Soft Prompting等现有技术不同,ART仅优化冻结的MLLM的原始视觉输入。这种方法允许在预编译引擎上进行软令牌风格的微调,并通过将梯度反向传播到像素数组来支持任何微调目标。ART在数学和结构化工具使用基准测试中,尤其是在开放的Qwen架构上,已证明与LoRA具有相当的准确性。 AI
影响 引入了一种新的参数高效微调技术,可能提高多模态大语言模型定制的效率和可访问性。
排序理由 该集群包含一篇详细介绍微调多模态大语言模型新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →