实体 Molmo2-4B

Molmo2-4B

PulseAugur coverage of Molmo2-4B — every cluster mentioning Molmo2-4B across labs, papers, and developer communities, ranked by signal.

总计 · 30天

1

90 天内 1

发布 · 30天

0

90 天内 0

论文 · 30天

1

90 天内 1

层级分布 · 90 天

最近 · 第 1/1 页 · 共 1 条

RESEARCH · CL_15490 · May 4 · 17:11

VideoNet 数据集在领域特定动作识别方面对视觉-语言模型提出挑战

研究人员推出了 VideoNet，这是一个旨在改进视频中领域特定动作识别的大规模数据集。该基准涵盖了 37 个领域中的 1000 种动作，突显了 Gemini 3.1 Pro 和 Qwen3-VL-8B 等视觉-语言模型 (VLM) 在这些任务上的准确性和少样本学习能力方面的局限性。为了解决这个问题，创建了一个包含近 50 万个视频问答对的新训练数据集，使得经过微调的 Molmo2-4B 模型在 VideoNet 上的表现优于现有的开…