PulseAugur
实时 13:51:31
实体 Meta-Attention

Meta-Attention

PulseAugur coverage of Meta-Attention — every cluster mentioning Meta-Attention across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_50648 ·

    新框架提升跨设备Transformer推理效率

    研究人员开发了新的方法来提高Transformer模型在多个设备上推理的效率。一种名为ASTRA的方法,将序列并行与混合精度注意力相结合,以减少设备间带宽需求,即使在低带宽网络上也能实现显著的加速。另一个框架Meta-Attention使用贝叶斯元控制器动态地将token路由到最合适的注意力策略,提供了更好的计算-性能权衡。此外,一项关于嵌入式边缘设备的研究表明,驱动剖析的适应对于实际的分布式Transformer推理至关重要,通过降…