PulseAugur
实时 08:42:41
English(EN) A Variational Framework for LLM Generator-Regulator Games

新框架模拟LLM中的受监管语言生成

研究人员开发了一个新的变分框架,用于模拟大型语言模型(LLM)中的受监管语言生成。该框架将自回归令牌采样与熵正则化吉布斯定律联系起来,并将监管建模为最优判别器,将生成器-调节器交互表述为鞍点问题。通过分析效用、熵、监管一致性和可检测性之间的权衡,该方法适用于各种审核和检测任务,包括AI欺骗检测、审查和网络钓鱼防御。 AI

影响 该框架可能带来更强大的方法来审核LLM输出和检测有害内容。

排序理由 该集群包含一篇详细介绍LLM监管新理论框架的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Quanyan Zhu ·

    A Variational Framework for LLM Generator-Regulator Games

    arXiv:2606.18424v1 Announce Type: cross Abstract: This paper develops a variational framework for regulated language generation. Starting from autoregressive token sampling, we derive the induced distribution over complete messages and relate it to an entropy-regularized Gibbs la…