Disentangled Safety Adapters
PulseAugur coverage of Disentangled Safety Adapters — every cluster mentioning Disentangled Safety Adapters across labs, papers, and developer communities, ranked by signal.
1 天有情绪数据
-
梵蒂冈发布首个人工智能通谕,关联欧盟法规
梵蒂冈发布了其首部完全致力于人工智能的通谕《Magnifica Humanitas》。该文件探讨了人工智能的伦理和监管维度,特别是其与人工智能法案、GDPR 和 DSA 等现有欧盟框架的交叉点。它还讨论了对自主武器的担忧,并包含关于人工智能责任、透明度和治理的具体指导。
-
解耦安全适配器提供高效的AI防护栏和灵活的对齐
研究人员开发了Disentangled Safety Adapters (DSA),一个旨在提高AI安全性和对齐性而又不牺牲推理效率或灵活性的新框架。DSA通过使用轻量级适配器与基础模型的现有表示集成,从而能够以最小的性能影响实现多样化的安全功能。实验表明,基于DSA的防护栏在仇恨言论检测和幻觉减少等任务上显著优于同等大小的独立模型,而基于DSA的对齐则实现了安全与性能权衡的动态、细粒度控制。
-
EU launches AI Resources site with glossary and cross-references to nine digital acts
A new website, AI resources.eu, has been launched to serve as an open, bilingual reference for the European Union's digital regulatory landscape. The site currently details nine key acts, including the AI Act and GDPR, …
-
DeepSeek V3.2 模型引入稀疏注意力以改进长上下文处理
DeepSeek 推出了其 V3.2 模型,集成了 DeepSeek Sparse Attention (DSA)。这项创新将注意力复杂度从 O(L²) 降低到 O(Lk),显著提高了长上下文处理的效率。该模型的架构还利用了 Lightning Indexer 以获得进一步的性能提升。