实体 Act2Answer

Act2Answer

PulseAugur coverage of Act2Answer — every cluster mentioning Act2Answer across labs, papers, and developer communities, ranked by signal.

总计 · 30天

2

90 天内 2

发布 · 30天

0

90 天内 0

论文 · 30天

2

90 天内 2

层级分布 · 90 天

主题

情绪 · 30 天

2 天有情绪数据

最近 · 第 1/1 页 · 共 2 条

TOOL · CL_106618 · Jun 17 · 17:20

新协议衡量VLA模型的常识知识

研究人员开发了Act2Answer，这是一个新的评估协议，旨在评估视觉-语言-动作（VLA）模型在机器人数据上进行微调后保留的常识和世界知识。该协议通过让智能体在桌面环境中通过特定动作选择答案来调整现有的VLM知识基准，从而减少与低级控制相关的混淆。对七个VLA模型和九个VLM基线的大规模研究表明，虽然VLA模型在简单概念上表现良好，但与它们的源VLM相比，它们在复杂语义领域表现出更大的知识差距。研究还表明，VQA联合训练有助于知识保…
RESEARCH · CL_93885 · Jun 16 · 04:00

新论文揭示视觉语言模型缺乏主体性和知识保留能力

两篇新研究论文指出了当前视觉语言模型（VLMs）的局限性，特别是在微调后保留知识的能力以及在视觉推理中缺乏“主体性”方面。第一篇论文《视觉-语言-动作模型是否了解基础知识？》引入了Act2Answer协议，通过让具身VLA模型通过动作选择答案来评估它们，结果显示它们在简单概念上表现良好，但在比其源VLMs更丰富的语义类别上却表现不佳。第二篇论文《主体性：视觉推理中系统性的主体性缺失》认为，VLMs受限于缺乏主体性，导致它们充当被动的语…