PulseAugur
实时 11:42:06
实体 S$^3$E

S$^3$E

PulseAugur coverage of S$^3$E — every cluster mentioning S$^3$E across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_79169 ·

    新框架探测多模态大语言模型的内部决策压力

    研究人员开发了一个名为 S$^3$E 的新框架,通过在语义压力下探测多模态语言模型的内部决策状态来评估它们。该方法将图像支持的字幕与语义上相似但错误的选项进行对比,分析隐藏状态以检测模型即使在外部行为保持正确时也可能存在的内部不稳定性。对 Qwen3VL、Gemma3 和 InternVL3 等模型的研究表明,语义压力会导致显著的内部状态位移,这表明仅凭外部正确性不足以保证稳定的内部决策几何。