PulseAugur
实时 10:47:24
实体 Molmo2-4B

Molmo2-4B

PulseAugur coverage of Molmo2-4B — every cluster mentioning Molmo2-4B across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_15490 ·

    VideoNet 数据集在领域特定动作识别方面对视觉-语言模型提出挑战

    研究人员推出了 VideoNet,这是一个旨在改进视频中领域特定动作识别的大规模数据集。该基准涵盖了 37 个领域中的 1000 种动作,突显了 Gemini 3.1 Pro 和 Qwen3-VL-8B 等视觉-语言模型 (VLM) 在这些任务上的准确性和少样本学习能力方面的局限性。为了解决这个问题,创建了一个包含近 50 万个视频问答对的新训练数据集,使得经过微调的 Molmo2-4B 模型在 VideoNet 上的表现优于现有的开…