研究人员正在探索使用视觉-语言模型(VLM)来更好地理解驾驶员行为和注意力。一项研究通过包含细粒度驾驶员活动描述的新数据集对 VLM 进行了调整,提高了对行为的解读准确性。另一篇论文研究了最少的人工监督如何指导 VLM 生成可解释的驾驶员注意力转移描述,以补充传统的注视热力图。 AI
影响 VLM 微调和数据集创建方面的进步可能带来更先进的驾驶员辅助和安全系统。
排序理由 两篇研究论文介绍了新的数据集和方法,用于将视觉-语言模型应用于驾驶员行为分析。
- Berkeley DeepDrive-Attention dataset
- Drive&Act dataset
- Driver Monitoring Dataset (DMD)
- Driver Monitoring Systems
- Vision-language Models
AI 生成摘要 · Google Gemini · 来自 3 个来源。 我们如何撰写摘要 →