实体
Multi-modal Large Language Models
Multi-modal Large Language Models
PulseAugur coverage of Multi-modal Large Language Models — every cluster mentioning Multi-modal Large Language Models across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
情绪 · 30 天
2 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
AI代理学习人类信念和空间推理
研究人员正在探索AI代理如何更好地理解人类的信念和意图,特别是在交互式场景中。一篇论文提出了一个二阶心智理论(ToM-2)框架,使用I-POMDP使代理能够检测并适应人类的认知偏差。另一项研究调查了多模态大型语言模型(MLLMs)在具身环境中的空间推理局限性,并引入了一个新的模块和推理链来提高它们在感知约束下推断另一代理观点的能力。
-
AI research questions video anomaly detection framing
Two new research papers challenge the current direction of video anomaly detection (VAD). The first paper argues that the field's focus on general models and multi-modal large language models (MLLMs) has shifted focus a…