实体
Mila
Mila
PulseAugur coverage of Mila — every cluster mentioning Mila across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
情绪 · 30 天
1 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
代理记忆研究质疑检索优先方法
两篇最新的研究论文表明,仅依赖检索来处理代理记忆对于长时程任务来说并非最优。其中一篇论文 Mem-π 证明,训练模型按需生成指导信息,而非检索静态条目,可以将网络导航任务的性能提高 30% 以上。另一篇论文 MINTEval 则指出,在大型上下文中,检索系统在处理矛盾或已修订的信息时会遇到困难,导致准确率显著下降。mnemo(一个代理记忆数据库)的作者承认了这些局限性,并计划实现一个干扰评估套件和一个解析器,以优先考虑最新、无矛盾的事…
-
新基准测试挑战多模态大语言模型(MLLMs)的空间和功能推理能力
研究人员引入了新的基准测试,用于评估多模态大语言模型(MLLMs)的空间和功能推理能力。这些基准测试旨在超越基本的几何感知,评估结构化空间推理和理解物体在特定情境下的效用等更高级的认知能力。实验表明,当前的多模态大语言模型在整合空间记忆、功能推理和外部知识方面存在困难,这凸显了实现具身智能的重大瓶颈。