实体 Qwen2.5VL-7B-Instruct

Qwen2.5VL-7B-Instruct

PulseAugur coverage of Qwen2.5VL-7B-Instruct — every cluster mentioning Qwen2.5VL-7B-Instruct across labs, papers, and developer communities, ranked by signal.

Show in brief

总计 · 30天

90 天内 1

发布 · 30天

90 天内 0

论文 · 30天

90 天内 1

层级分布 · 90 天

主题

论文 1
模型发布 1

情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条

TOOL · CL_114371 · Jun 20 · 03:53

视觉语言模型在课堂参与度识别方面表现不佳

一项新的基准研究评估了五种视觉语言模型（VLMs）在零样本设置下识别课堂参与度的能力。包括GPT-4o和LLaVA-1.5-7B在内的模型在识别单个学生参与度方面表现不佳，呈现出随机表现和类别坍塌。然而，场景级分类显示出更大的潜力，CLIP和GPT-4o在提供特定评分标准提示时达到了中等准确率。研究还强调了实际部署的挑战，例如GPT-4o的安全过滤器拒绝了大量涉及学生面部的请求。

视觉语言模型在课堂参与度识别方面表现不佳