PulseAugur
实时 08:23:36
实体 Multimodal Contextual Reasoning (MCR)

Multimodal Contextual Reasoning (MCR)

PulseAugur coverage of Multimodal Contextual Reasoning (MCR) — every cluster mentioning Multimodal Contextual Reasoning (MCR) across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_84536 ·

    InternVideo3 增强视频理解能力,引入新推理框架

    研究人员推出了 InternVideo3,一个旨在提升长时视频理解和代理能力的新框架。该系统利用多模态上下文推理(MCR)将视频内容处理为不断演变的上下文,从而在延长时间内进行证据累积和验证。为了保持效率,InternVideo3 采用了多模态多头潜在注意力(M^2LA),该机制在不丢失 token 信息的情况下压缩键值缓存状态。该模型在各种视频理解基准测试中表现出色,并已被改编成一个能够进行证据支撑检索任务的视频代理。