实体
ARMOR 2025
ARMOR 2025
PulseAugur coverage of ARMOR 2025 — every cluster mentioning ARMOR 2025 across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
最近 · 第 1/1 页 · 共 2 条
-
新的RAG方法绕过向量数据库;LLM显示军事安全漏洞
一个名为ARMOR 2025的新基准已被开发出来,用于评估大型语言模型(LLM)在军事安全和法律原则方面的表现。该基准测试了21种不同的LLM,并揭示了显著的安全漏洞,这些漏洞通常不会被以民用为中心的评估所识别。另外,一种新的检索增强生成(RAG)方法已被提出,据称该方法可以绕过对传统向量数据库的需求,可能扰乱这些技术的现有市场。
-
新基准揭示军用大语言模型合规性差距和越狱漏洞
一项名为 ARMOR 2025 的新军方对齐安全基准已被推出,用于评估大型语言模型在遵守战争法和交战规则等军事学说方面的合规性。初步结果表明,许多商业大语言模型未能达到这些学说标准。此外,一项新研究提出了 LOCA 方法,用于揭示大语言模型越狱背后的最小、局部因果解释,这可能显著改变 AI 安全策略。