实体
THUMOS14
THUMOS14
PulseAugur coverage of THUMOS14 — every cluster mentioning THUMOS14 across labs, papers, and developer communities, ranked by signal.
总计 · 30天
3
90 天内 3
发布 · 30天
0
90 天内 0
论文 · 30天
3
90 天内 3
层级分布 · 90 天
主题
情绪 · 30 天
3 天有情绪数据
最近 · 第 1/1 页 · 共 3 条
-
SpikeTAD uses SNNs for low-power video action detection
Researchers have developed SpikeTAD, a novel Spiking Neural Network (SNN) architecture for end-to-end temporal action detection in videos. This approach aims to address the high power consumption and large model sizes o…
-
ConTrans 模型推动零样本视频动作定位
研究人员开发了一个名为 ConTrans 的新模型,以改进视频中的零样本时序动作定位。该模型集成了卷积层和 Transformer 自注意力机制,以更好地捕捉局部帧相关性和长程全局上下文。ConTrans 在 ActivityNet-1.3 和 THUMOS14 数据集上树立了新的基准,在检测未见过动作方面优于现有方法。
-
新的TEGU方法使用文本定位视频中未见过的动作
研究人员开发了一种名为TEGU的新方法,用于视频中的零样本时序动作定位。该方法利用大型语言模型和字幕的文本信息,以提高动作的细粒度区分能力,尤其是在标记训练数据稀缺的情况下。TEGU旨在克服现有视觉和语言模型在区分细微动作差异方面的局限性。在THUMOS14和ActivityNet-v1.3数据集上的实验表明,TEGU的表现优于当前不依赖训练数据最先进的方法。