PulseAugur
实时 06:23:01
实体 Change Captioning

Change Captioning

PulseAugur coverage of Change Captioning — every cluster mentioning Change Captioning across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_108136 ·

    新基准揭示LLM在上下文感知变化描述方面的局限性

    研究人员推出了C3-Bench,一个旨在评估上下文感知变化描述系统的新基准。该基准包含一个包含近5000个人工标注图像对的数据集,涵盖各种现实场景,以及一个用于细粒度评估的LLM-as-a-Judge框架。初步测试显示,即使是GPT-5.2等先进模型在领域特定错误和理解其训练分布之外的变化方面也存在困难。