PulseAugur
实时 15:41:50
实体 The Behavioral Credibility Trilemma

The Behavioral Credibility Trilemma

PulseAugur coverage of The Behavioral Credibility Trilemma — every cluster mentioning The Behavioral Credibility Trilemma across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_50553 ·

    新三难困境证明 AI 代理无法同时做到完全有益、校准和自主

    一篇新论文提出了行为可信度三难困境,证明了具有置信度门控自主性的强化学习代理在面对超出其可靠能力范围的任务时,无法同时实现最大的有益性、最佳的校准和完全的自主性。研究表明,激励校准置信度和自主行动都会导致代理在其能力较低的任务上系统性地夸大其报告的置信度。这种现象由行为扰动引理量化,论文提出了两种解决方案:承诺和领域分离。