PulseAugur
实时 07:20:45
实体 Soligo et al 2025

Soligo et al 2025

PulseAugur coverage of Soligo et al 2025 — every cluster mentioning Soligo et al 2025 across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
0
90 天内 0
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_89542 ·

    专业化AI裁判未能降低审计成本,帮助有限

    一位研究人员探索使用轻量级、专业化的裁判模型(Gemma 2-2B)来协助AI代理在审计中识别不一致性。虽然代理模型一致使用该裁判模型,但仅在训练数据直接匹配不一致性类型且主要审计模型(Sonnet)已遇到困难的特定场景下才证明有帮助。该实验并未降低整体评估成本,因为主要驱动模型占了绝大多数费用,并且强制工具使用甚至增加了成本。