实体
VLM agents
VLM agents
PulseAugur coverage of VLM agents — every cluster mentioning VLM agents across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
情绪 · 30 天
2 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
新的 GROW 框架通过适配的 GRPO 增强 VLM 代理
研究人员推出了一种新颖的强化学习框架 GROW,旨在增强视觉语言模型 (VLM) 代理在开放世界任务中的能力。与以往严重依赖监督微调的方法不同,GROW 通过将轨迹分解为状态-动作样本来适配 Group Relative Policy Optimization (GRPO) 算法。这种方法缓解了标准 GRPO 中固有的长上下文和噪声问题,实现了更有效的多轮学习。在超过 800 个 Minecraft 任务上的实验表明,GROW 达到了…
-
AtlasVA framework enhances VLM agents with visual skill memory
Researchers have introduced AtlasVA, a novel framework designed to enhance the visual skill memory of vision-language model (VLM) agents. Unlike existing methods that convert visual information into text, AtlasVA mainta…