PulseAugur
实时 12:26:33
实体 Shubham Aggarwal

Shubham Aggarwal

PulseAugur coverage of Shubham Aggarwal — every cluster mentioning Shubham Aggarwal across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_115691 ·

    Prism Transformer 引入分层注意力的渐进式头调度

    研究人员推出 Prism Transformer,这是一种新颖的架构,可修改标准的多头注意力机制。Prism Transformer 不在每个层中为每个注意力头分配相等的维度空间,而是跨层渐进地增加头的数量。这种方法建立了从局部到全局的表示层次结构,使早期层能够用更宽的头捕获复杂的局部模式,而更深的层则用更窄的头进行专业化。该架构是参数中性的,不会引入额外的训练或推理开销,但在下游零样本基准测试中始终优于统一基线。