实体
Mixture-of-Experts (MoE) LLMs
Mixture-of-Experts (MoE) LLMs
PulseAugur coverage of Mixture-of-Experts (MoE) LLMs — every cluster mentioning Mixture-of-Experts (MoE) LLMs across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天
2 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
新方法引导专家混合模型中的拒绝行为
研究人员开发了新的方法来引导专家混合(MoE)大型语言模型中的拒绝行为。他们发现现有的引导向量技术即使在MoE架构下仍然有效。所提出的专家感知方法通过利用特定的专家路由模式和方向,进一步增强了这种引导,表明拒绝信号可以被单个专家有效地控制。
-
RouteScan 使用非侵入式路由遥测审计 MoE LLM 安全性
研究人员开发了 RouteScan,这是一个新颖的框架,用于审计混合专家(MoE)大型语言模型(LLM)的安全性,而无需访问敏感用户数据。这种非侵入式方法通过分析低级 GPU 执行遥测数据,特别是专家路由模式,来检测有害行为。在开源 MoE 模型上的评估表明,RouteScan 即使在未见过的有害领域和新颖的越狱技术上也能实现高度泛化和准确性,同时比基于内容的审计具有隐私优势。