实体 Vision-Action

Vision-Action

PulseAugur coverage of Vision-Action — every cluster mentioning Vision-Action across labs, papers, and developer communities, ranked by signal.

总计 · 30天

1

90 天内 1

发布 · 30天

0

90 天内 0

论文 · 30天

1

90 天内 1

层级分布 · 90 天

主题

情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条

TOOL · CL_92089 · Jun 10 · 00:00

新的APT方法通过动作专家预训练提升VLA模型的泛化能力

研究人员开发了一种名为APT（动作专家预训练）的新方法，以提高视觉-语言-动作（VLA）模型的泛化能力。这些模型结合了视觉-语言理解和动作执行，但常常难以处理与其训练数据不同的指令。APT通过首先在视觉-动作对上预训练动作专家，建立一个稳定的基础，然后再整合语言条件来实现这一目标。这种两阶段的方法有助于防止训练数据中的语言不平衡破坏模型的视觉运动技能，并增强其遵循新指令的能力。