PulseAugur
实时 13:53:34
实体 SingGuard

SingGuard

PulseAugur coverage of SingGuard — every cluster mentioning SingGuard across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天

2 天有情绪数据

最近 · 第 1/1 页 · 共 2 条
  1. TOOL · CL_106814 ·

    新型防护栏系统SingGuard可适应VLMs的动态安全策略

    研究人员开发了SingGuard,一个新颖的策略自适应防护栏系统,旨在增强视觉语言模型(VLMs)的安全性。与具有固定规则的现有防护栏不同,SingGuard通过将安全策略视为运行时输入来动态适应不断变化的策略,从而能够根据特定的自然语言规则评估内容。该系统通过强化学习进行了优化,提供从直接判断到详细的策略推理等灵活的推理速度。为了评估其有效性,创建了一个新的基准测试SingGuard-Bench,其中包含超过56,000个示例,涵盖…

  2. RESEARCH · CL_99607 ·

    新的RL技术增强LLM推理、安全性和效率 · 跟踪8个来源

    研究人员引入了几种新方法来改进用于大型语言模型(LLM)的强化学习(RL),以解决奖励稀疏性、信用分配和效率等挑战。Group-Graph Policy Optimization (G2PO) 将线性轨迹转换为状态转换图,以更好地进行长周期任务中的信用分配。SingGuard 提供了一种自适应策略的多模态安全护栏,用于对话中的安全评估,并能适应不断变化的审核规则。此外,Adaptive Correct-Only Efficiency …