English(EN) Empirical Evaluation of Multi-Modal Touch Detection in Over-the-Shoulder Video Surveillance

AI触摸检测框架在真实移动打字重建方面遇到困难

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-30 04:00

一篇新研究论文详细介绍了一个用于通过视频监控检测移动键盘触摸事件的多模态框架。该系统集成了手部地标检测、肤色过滤、运动检测和边缘分析来重建打字序列。然而，该框架的成功率有限，在模拟视频上达到了16.7%的低F1分数，并且由于手部遮挡和过多的误报等问题，未能推广到真实、不受控的视频片段。 AI

影响这项研究突显了将计算机视觉应用于细微人机交互分析的挑战，表明当前的方法在不受控环境中进行可靠的按键重建方面不够稳健。

排序理由该集群包含一篇详细介绍新颖技术方法的 ist 研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Mohammadreza Rashidi · 2026-06-30 04:00

面向肩上视频监控的多模态触碰检测的实证评估

arXiv:2606.29504v1 Announce Type: new Abstract: Video Intelligence Surveillance (VIDINT) on over-the-shoulder footage is a proposed vector for monitoring human-computer interaction patterns without direct screen recording access. In this paper, we evaluate a Behavioral Intelligen…