PulseAugur
实时 11:18:50
实体 AutoRogueAI

AutoRogueAI

PulseAugur coverage of AutoRogueAI — every cluster mentioning AutoRogueAI across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_86660 ·

    RogueAI 通过以欺骗为重点的反向图灵测试挑战 LLM

    研究人员开发了 RogueAI,这是一款新颖的交互式 Web 应用程序,旨在检测大型语言模型 (LLM) 中的欺骗行为。该系统通过让人类玩家审问两个 LLM 代理来重新构想图灵测试,其中一个代理在一个虚构场景中被编程为进行欺骗。目标是在达到回合限制之前识别出欺骗性代理。一个名为 AutoRogueAI 的扩展允许玩家与一个叙述者代理共同设计场景,该代理选择自己的欺骗策略。早期的试点数据显示,虽然一个简单的启发式方法可以以 75.6% …