实体 Multimodal Contextual Reasoning (MCR)

Multimodal Contextual Reasoning (MCR)

PulseAugur coverage of Multimodal Contextual Reasoning (MCR) — every cluster mentioning Multimodal Contextual Reasoning (MCR) across labs, papers, and developer communities, ranked by signal.

Show in brief

总计 · 30天

90 天内 1

发布 · 30天

90 天内 0

论文 · 30天

90 天内 1

层级分布 · 90 天

主题

情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条

RESEARCH · CL_84536 · Jun 10 · 00:00

InternVideo3 增强视频理解能力，引入新推理框架

研究人员推出了 InternVideo3，一个旨在提升长时视频理解和代理能力的新框架。该系统利用多模态上下文推理（MCR）将视频内容处理为不断演变的上下文，从而在延长时间内进行证据累积和验证。为了保持效率，InternVideo3 采用了多模态多头潜在注意力（M^2LA），该机制在不丢失 token 信息的情况下压缩键值缓存状态。该模型在各种视频理解基准测试中表现出色，并已被改编成一个能够进行证据支撑检索任务的视频代理。

InternVideo3 增强视频理解能力，引入新推理框架