PulseAugur
实时 09:59:46
实体 EgoSAT

EgoSAT

PulseAugur coverage of EgoSAT — every cluster mentioning EgoSAT across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_107926 ·

    新的EgoSAT基准测试视觉语言模型在以自我为中心的视频推理能力

    研究人员推出了EgoSAT,一个旨在评估视觉语言模型(VLMs)理解以自我为中心的视频流能力的新基准。该基准将各种任务统一到一个单一的流式框架中,要求模型根据顺序到达的视频帧对过去、现在和未来的事件进行推理。在EgoSAT上的评估显示,当前的VLMs在时间推理方面存在困难,并且表现出显著的校准不足,经常对错误的预测表现出高度自信。