PulseAugur
实时 22:58:44
实体 Multimodal Large Language Models (MLLMs)

Multimodal Large Language Models (MLLMs)

PulseAugur coverage of Multimodal Large Language Models (MLLMs) — every cluster mentioning Multimodal Large Language Models (MLLMs) across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 2 条
  1. TOOL · CL_27988 ·

    DRAPE框架为多模态LLM生成实例特定的提示

    研究人员开发了DRAPE,一个用于多模态持续指令微调(MCIT)的新型框架,该框架为多模态大型语言模型生成实例特定的软提示。与依赖任务级提示的现有方法不同,DRAPE通过对文本指令和视觉特征进行条件化,合成针对单个查询-图像对定制的连续提示。该框架还采用了空空间梯度投影和基于CLIP的原型路由等技术,以防止在顺序任务获取过程中发生灾难性遗忘,并在MCIT基准测试中取得了最先进的成果。

  2. TOOL · CL_28261 ·

    GuardAD 通过动态逻辑增强自动驾驶 MLLM 的安全性

    研究人员开发了 GuardAD,一种增强自动驾驶系统所用多模态大语言模型 (MLLM) 安全性的新方法。GuardAD 采用动态的、马尔可夫逻辑状态方法来推理不断变化的交通交互,解决了当前静态安全机制的局限性。这使得系统能够在超出即时观察范围的情况下推断潜在危险,并在不改变核心 MLLM 的情况下主动优化行为,从而显著降低事故率。