实体 Model weights

Model weights

PulseAugur coverage of Model weights — every cluster mentioning Model weights across labs, papers, and developer communities, ranked by signal.

总计 · 30天

1

90 天内 2

发布 · 30天

0

90 天内 0

论文 · 30天

0

90 天内 1

层级分布 · 90 天

主题

情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 2 条

RESEARCH · CL_155420 · Jul 21 · 14:50

中国考虑对模型权重和芯片设计实施人工智能出口管制

中国正在考虑对包括模型权重、训练数据和芯片设计在内的关键人工智能组件实施出口管制。此举目前正与国内人工智能和芯片公司协商，可能会显著改变全球对中国人工智能技术的获取，并影响到台积电等国际芯片制造商。这些潜在法规的确切范围和最终细节仍未确定。
RESEARCH · CL_06772 · Apr 28 · 04:00

Transformer研究深入探讨安全漏洞、训练动态和上下文学习的局限性

研究人员发现了用于在推理过程中保护Transformer模型的混洗防御机制中的漏洞，并演示了一种通过对齐置换激活来提取模型权重的攻击。另一项研究深入探讨了Transformer训练的光谱动态，揭示了编码学习过程不同方面的瞬态压缩波和持久光谱梯度。此外，对上下文学习的调查表明，先前的示例会干扰模型适应新任务的能力，训练课程显著影响弹性，并且泛化能力取决于预训练任务是从子空间并集还是单个高斯分布中提取的。