PulseAugur
实时 22:53:34
实体 Video Large Language Models

Video Large Language Models

PulseAugur coverage of Video Large Language Models — every cluster mentioning Video Large Language Models across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_45034 ·

    EvoVid框架使视频大语言模型能够利用原始视频数据进行自进化

    研究人员推出了一种名为EvoVid的新型框架,旨在通过时间中心自进化来增强视频大语言模型(Video-LLMs)。与以往仅限于静态数据的自进化方法不同,EvoVid通过关注时间动态,使Video-LLMs能够直接从原始、未标注的视频中学习。该框架结合了用于问题生成和视频片段定位的专门奖励,从而在多个基准测试和基础模型上实现了持续的性能提升。