English(EN) Fine-tuning Multi-modal LLMs with ART: Art-based Reinforcement Training

新的ART方法通过视觉输入优化微调多模态大语言模型

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-10 09:30

研究人员引入了一种名为基于艺术的强化训练（ART）的新方法，用于微调多模态大语言模型（MLLMs）。与修改计算图的LoRA和Soft Prompting等现有技术不同，ART仅优化冻结的MLLM的原始视觉输入。这种方法允许在预编译引擎上进行软令牌风格的微调，并通过将梯度反向传播到像素数组来支持任何微调目标。ART在数学和结构化工具使用基准测试中，尤其是在开放的Qwen架构上，已证明与LoRA具有相当的准确性。 AI

影响引入了一种新的参数高效微调技术，可能提高多模态大语言模型定制的效率和可访问性。

排序理由该集群包含一篇详细介绍微调多模态大语言模型新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Tomasz Wiktorski · 2026-06-10 09:30

使用ART进行多模态大模型的微调：基于艺术的强化训练

There are two main Parameter-Efficient Fine-Tuning (PEFT) techniques for Large Language Models (LLMs). While Low-Rank Adaptation (LoRA) introduces additional weights between the LLM layers, Soft Prompting introduces additional fine-tuning-specific raw tokens to an LLM input. Howe…

报道来源 [1]

使用ART进行多模态大模型的微调：基于艺术的强化训练

相关实体

相关话题