实体 ClaimDiff-RL

ClaimDiff-RL

PulseAugur coverage of ClaimDiff-RL — every cluster mentioning ClaimDiff-RL across labs, papers, and developer communities, ranked by signal.

总计 · 30天

0

90 天内 2

发布 · 30天

0

90 天内 0

论文 · 30天

0

90 天内 2

层级分布 · 90 天

主题

最近 · 第 1/1 页 · 共 2 条

TOOL · CL_50516 · May 24 · 00:00

新的强化学习框架提高了图像字幕准确性

研究人员开发了ClaimDiff-RL，一个旨在提高长篇图像字幕准确性和完整性的新颖框架。该方法通过将字幕评估分解为原子视觉声明，解决了传统强化学习的局限性。ClaimDiff-RL允许分别测量和调整与幻觉（添加虚假信息）和遗漏（遗漏重要细节）相关的错误，从而生成更平衡、更具信息量的字幕。实验表明，与整体评分方法相比，该方法对字幕质量提供了更细粒度的控制，甚至在特定的视觉理解任务上超越了Gemini-3-Pro-Preview等模型。
TOOL · CL_44680 · May 22 · 04:00

新的强化学习框架通过比较视觉声明来改进图像字幕

研究人员开发了ClaimDiff-RL，一种使用强化学习改进长格式图像字幕的新颖框架。该方法通过关注单个视觉声明而非整个字幕序列来解决奖励粒度问题。一个多模态裁判评估生成字幕和参考字幕之间的差异，分配错误类型和严重程度，以微调事实准确性和信息覆盖范围之间的平衡。实验表明，ClaimDiff-RL在特定的细粒度能力上实现了更好的幻觉-覆盖权衡，并超越了Gemini-3-Pro-Preview。