PulseAugur
实时 15:27:22
实体 Qwen2.5VL-7B-Instruct

Qwen2.5VL-7B-Instruct

PulseAugur coverage of Qwen2.5VL-7B-Instruct — every cluster mentioning Qwen2.5VL-7B-Instruct across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_114371 ·

    视觉语言模型在课堂参与度识别方面表现不佳

    一项新的基准研究评估了五种视觉语言模型(VLMs)在零样本设置下识别课堂参与度的能力。包括GPT-4o和LLaVA-1.5-7B在内的模型在识别单个学生参与度方面表现不佳,呈现出随机表现和类别坍塌。然而,场景级分类显示出更大的潜力,CLIP和GPT-4o在提供特定评分标准提示时达到了中等准确率。研究还强调了实际部署的挑战,例如GPT-4o的安全过滤器拒绝了大量涉及学生面部的请求。