PulseAugur
实时 06:14:13
实体 DCC

DCC

PulseAugur coverage of DCC — every cluster mentioning DCC across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_48989 ·

    新编译器DCC优化内存处理架构上的机器学习内核

    研究人员开发了DCC,这是一种新颖的以数据为中心的编译器,旨在优化内存处理(PIM)架构上的机器学习内核。该编译器通过联合优化数据重排和计算代码优化这两个相互依赖的过程来应对挑战。DCC通过多层抽象支持多个PIM后端,并已展示出显著的加速效果,与仅使用GPU相比,在HBM-PIM上实现了高达7.68倍的加速,在AttAcc PIM上实现了13.17倍的加速。对于端到端的LLM推理,AttAcc上的DCC将GPT-3和LLaMA-2的平…