PulseAugur
实时 10:28:07
实体 GQA-to-MLA transition

GQA-to-MLA transition

PulseAugur coverage of GQA-to-MLA transition — every cluster mentioning GQA-to-MLA transition across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_72547 ·

    YouZhi-LLM通过自适应KV缓存压缩提升金融AI并发能力

    研究人员开发了YouZhi-LLM,这是一种专为高并发金融应用设计的新型大型语言模型。该模型利用一种新颖的自适应GQA到MLA转换框架来最大化KV缓存压缩,显著降低了内存开销和基础设施成本。YouZhi-LLM与华为Ascend生态系统和专用训练流水线集成,与基础模型相比,在金融基准测试得分上有所提高,部署并发性也大幅提升。