PulseAugur
实时 21:13:54
实体 Shijie Zhou

Shijie Zhou

PulseAugur coverage of Shijie Zhou — every cluster mentioning Shijie Zhou across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 2 条
  1. TOOL · CL_119574 ·

    新的GUI-AIMA框架增强了多模态LLM的基础能力

    研究人员开发了GUI-AIMA,一个用于改进多模态大语言模型(MLLMs)中图形用户界面(GUI)基础的新型框架。这种基于注意力的方法将内在多模态注意力与逐块基础信号对齐,实现了更高效、数据量更少(data-light)的训练。GUI-AIMA-3B仅用509k个样本就达到了3B模型中的最先进性能,展示了显著的数据效率。

  2. TOOL · CL_15783 ·

    SpatialStack: 用于3D视觉语言模型空间推理的分层几何语言融合

    研究人员推出SpatialStack,一个旨在增强大型视觉语言模型(VLMs)3D空间推理能力的新型框架。该方法通过在模型层级内的多个层面逐步对齐视觉、几何和语言表示来解决当前VLMs的局限性,而不是仅仅依赖于后期融合。基于该框架构建的VLM-SpatialStack模型在各种3D空间推理基准测试中展现了最先进的性能,表明其3D理解和泛化能力有所提高。