PulseAugur
实时 07:33:55
实体 BudgetFormer

BudgetFormer

PulseAugur coverage of BudgetFormer — every cluster mentioning BudgetFormer across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_05064 ·

    BudgetFormer 通过自适应注意力头分配降低 Transformer 成本

    研究人员开发了 BudgetFormer,一种 Transformer 架构,通过动态分配计算资源来优化多头注意力的使用。这种新机制学会为每个输入选择信息量最大的注意力头,减少不必要的计算并可能提高性能。在文本分类任务上的实验表明,BudgetFormer 在匹配或超过标准全多头注意力的有效性的同时,可以减少 FLOPs 和内存使用。