PulseAugur
实时 11:17:20
实体 Noor S. Mohammad

Noor S. Mohammad

PulseAugur coverage of Noor S. Mohammad — every cluster mentioning Noor S. Mohammad across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天

2 天有情绪数据

最近 · 第 1/1 页 · 共 2 条
  1. TOOL · CL_93686 ·

    新的MIRAGE基准揭示了大型语言模型中加剧的反穆斯林偏见

    一个名为MIRAGE的新基准已被开发出来,用于评估大型语言模型中的反穆斯林偏见,它超越了简单的提示完成,评估了推理、代理决策和时序耦合条件。研究发现,思维链推理会加剧偏见,代理决策表现出不对称性,并且偏见会随着近期冲突背景的增加而增加。现有的缓解技术在这些条件下转移性很差。

  2. RESEARCH · CL_93172 ·

    新框架认证 AI 生成数学证明的忠实度

    研究人员引入了双向可证性指纹(BPF)框架,旨在认证自动形式化数学陈述的忠实度。该方法解决了翻译后的形式陈述可能可证但与原始自然语言意图在语义上不完全等价的挑战。该框架包括生成反事实探针、用于连续评分的等价性谱、自适应预算分配以及忠实度引导解码的组件。还发布了一个新的基准 DriftBench,包含 2,183 对自然语言/Lean 4 对,用于评估这些方法。