PulseAugur
实时 14:57:02
实体 NormPerceptor

NormPerceptor

PulseAugur coverage of NormPerceptor — every cluster mentioning NormPerceptor across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_115219 ·

    新基准揭示大型语言模型在规划中难以遵守隐藏的社会规范

    研究人员推出了 NormAct,这是一个旨在评估多模态大型语言模型(MLLMs)在具身规划任务中遵守隐藏社会规范能力的新基准。使用 GPT-5.4、Claude Opus 4.7 和 Gemini 3 Pro 进行的实验表明,虽然这些模型可以实现明确的目标,但它们在隐式社会遵从方面存在显著困难,成功率仅为 26.4%。为了解决这个问题,提出的 NormPerceptor 系统帮助模型推断和应用相关规范,将整体任务成功率从 24.2% …