PulseAugur
实时 12:40:04
实体 PolicyGuard

PolicyGuard

PulseAugur coverage of PolicyGuard — every cluster mentioning PolicyGuard across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 2 条
  1. TOOL · CL_119454 ·

    新框架采用神经符号方法进行策略合规审查

    研究人员开发了PolicyGuard,一个新颖的神经符号框架,旨在加强文档的组织策略合规性审查。该系统将策略指南转换为一个可执行引擎,该引擎由关系逻辑规则和特定的提取问题组成。然后,利用大型语言模型通过分析文档证据来回答这些问题,并由符号评估器应用形式化规则来识别任何不合规之处。PolicyGuard旨在通过分离策略形式化、本地解释和符号评估,使文档审查过程更加透明、可维护和可测试。

  2. RESEARCH · CL_99526 ·

    新的基准和安全方法出现,用于先进的大模型代理

    新研究探讨了AI代理的开发和评估,重点关注它们在复杂环境中导航和遵守策略的能力。StarDojo在《星露谷物语》等开放式模拟中对代理性能进行基准测试,揭示了视觉理解和推理方面的局限性。CostBench在动态旅行规划场景中评估大模型代理的成本最优规划和适应能力,显示出经济推理方面的显著差距。其他论文介绍了使用基于自我报告的具身大模型代理进行个体模拟的方法,开发用于高效多代理推理的符号通信,以及解决由长时域代理中的上下文压缩引起的“治理…