实体
Concept Activation Vectors
Concept Activation Vectors
PulseAugur coverage of Concept Activation Vectors — every cluster mentioning Concept Activation Vectors across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天
2 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
新方法引导视频世界模型中的物理推理
研究人员开发了一种称为物理引导的方法来控制视频世界模型的物理推理。该技术使用 VideoMAE 模型特定层中的线性探针的权重向量,该向量被识别为概念激活向量 (CAV)。通过在推理过程中将此 CAV 注入模型的隐藏状态,研究人员可以在不改变模型权重的情况下操纵模型对物理合理性的预测。在 IntPhys 基准测试上的实验表明,这种干预能够可靠地改变模型的判断,证实了物理表示是局部化且可引导的。
-
新框架增强了深度学习概念可解释性的稳定性
研究人员推出$\alpha$-TCAV,一个旨在提高深度学习可解释性中概念激活向量(CAVs)的统计稳定性和实际效用的新框架。所提出的方法通过用一个平滑的、参数化的函数替换一个不连续的函数,解决了标准TCAV分数的一个基本缺陷,该缺陷可能导致结果不稳定。这种泛化统一了现有的TCAV变体,并为参数调优提供了原则性的指导,有可能以更低的计算成本实现更可靠的概念影响测量。