PulseAugur
实时 07:00:41
实体 Qwen2.5-VL 3B

Qwen2.5-VL 3B

PulseAugur coverage of Qwen2.5-VL 3B — every cluster mentioning Qwen2.5-VL 3B across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_27337 ·

    苹果研究人员用新的RL框架平衡图像字幕生成

    苹果研究人员开发了BalCapRL,一个用于基于强化学习的多模态大语言模型图像字幕生成的新框架。该方法旨在平衡字幕质量的多个维度,包括正确性、参考覆盖率和语言流畅性,而这些维度在现有方法中常常被牺牲。BalCapRL利用奖励解耦归一化和长度条件奖励掩码来优化这些目标,在LLaVA和Qwen等各种基础模型上显示出显著的改进。