PulseAugur
实时 10:24:09
实体 Did-You-Lie (DYL)

Did-You-Lie (DYL)

PulseAugur coverage of Did-You-Lie (DYL) — every cluster mentioning Did-You-Lie (DYL) across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_86741 ·

    新的测试平台揭示了 AI 测谎仪的局限性

    研究人员开发了评估语言模型测谎仪的新方法,解决了现有测试平台往往无法确保模型真正相信其陈述的反面这一挑战。该研究引入了 13 种具有已验证隐藏信念的推理模型生物,以及一个名为 Varied Deception 的提示式撒谎测试平台。在 31 个开源模型上,测谎仪在提示式撒谎方面与模型能力呈比例扩展,但基于激活和对数概率的方法在处理训练过的模型生物方面遇到了困难。思维链法官表现最佳,尽管部分原因在于验证方法。