English(EN) A Variational Framework for LLM Generator-Regulator Games

新框架模拟LLM中的受监管语言生成

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-18 04:00

研究人员开发了一个新的变分框架，用于模拟大型语言模型（LLM）中的受监管语言生成。该框架将自回归令牌采样与熵正则化吉布斯定律联系起来，并将监管建模为最优判别器，将生成器-调节器交互表述为鞍点问题。通过分析效用、熵、监管一致性和可检测性之间的权衡，该方法适用于各种审核和检测任务，包括AI欺骗检测、审查和网络钓鱼防御。 AI

影响该框架可能带来更强大的方法来审核LLM输出和检测有害内容。

排序理由该集群包含一篇详细介绍LLM监管新理论框架的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Quanyan Zhu · 2026-06-18 04:00

A Variational Framework for LLM Generator-Regulator Games

arXiv:2606.18424v1 Announce Type: cross Abstract: This paper develops a variational framework for regulated language generation. Starting from autoregressive token sampling, we derive the induced distribution over complete messages and relate it to an entropy-regularized Gibbs la…

报道来源 [1]

A Variational Framework for LLM Generator-Regulator Games

相关实体

相关话题