实体 SecFid

SecFid

PulseAugur coverage of SecFid — every cluster mentioning SecFid across labs, papers, and developer communities, ranked by signal.

总计 · 30天

1

90 天内 1

发布 · 30天

0

90 天内 0

论文 · 30天

1

90 天内 1

层级分布 · 90 天

主题

情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条

TOOL · CL_119482 · Jul 1 · 04:00

新基准揭示了大型语言模型防御中的安全-保真度权衡

一个名为 SecFid 的新基准已被开发出来，用于衡量大型语言模型 (LLM) 在面对提示注入攻击时，安全性和保真度之间的权衡。研究人员发现，目前针对这些攻击的防御措施常常会损害模型忠实处理和保留信息的能力，尤其是在翻译或文档编辑等任务中。在大量示例和配置中，没有模型或防御措施能够同时实现高安全性和高保真度，最安全的防御措施会显著降低保真度，反之亦然。研究表明，最佳平衡取决于具体的部署环境以及安全漏洞和数据丢失的相对成本。