PulseAugur
实时 20:45:10
English(EN) How VLAs Fail Differently: Black-Box Action Monitoring Reveals Architecture-Specific Failure Signatures

研究:VLA 模型根据架构出现可预测的失败模式

一篇新研究论文揭示,视觉语言动作 (VLA) 模型根据其底层架构表现出不同的失败模式。研究发现,虽然方向反转率是 VLA 失败的通用预测指标,但诸如加速度和速度违规等其他监控方法仅在与特定 VLA 架构匹配时才有效。这表明,一刀切的 VLA 安全监控方法是不够的,特定架构的监控对于可靠部署至关重要。 AI

影响 强调了 VLA 模型中特定架构安全监控的必要性,可能影响未来的开发和部署策略。

排序理由 该集群包含一篇研究论文,详细介绍了 VLA 模型失败和安全监控的发现。

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

研究:VLA 模型根据架构出现可预测的失败模式

报道来源 [2]

  1. arXiv cs.LG TIER_1 English(EN) · Krishnam Gupta ·

    VLAs 如何以不同方式失效:黑盒动作监控揭示架构特定的失效特征

    arXiv:2605.28726v1 Announce Type: cross Abstract: We discover that VLA architectures fail in fundamentally different, predictable ways at the motor-command level. Running VQ-BeT, Diffusion Policy, and ACT on identical evaluation protocols (n=450 episodes across PushT and ALOHA 14…

  2. arXiv cs.LG TIER_1 English(EN) · Krishnam Gupta ·

    VLAs 如何以不同方式失效:黑盒动作监控揭示架构特定的失效特征

    We discover that VLA architectures fail in fundamentally different, predictable ways at the motor-command level. Running VQ-BeT, Diffusion Policy, and ACT on identical evaluation protocols (n=450 episodes across PushT and ALOHA 14-DOF bimanual manipulation), we find: (1) directio…