PulseAugur
实时 06:30:47
实体 DeepSeek-R1-Distill

DeepSeek-R1-Distill

PulseAugur coverage of DeepSeek-R1-Distill — every cluster mentioning DeepSeek-R1-Distill across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_32717 ·

    新的 KV 缓存压缩方法 alpha 优于现有技术

    研究人员开发了一种新的 KV 缓存压缩方法 alpha,它使用多样性惩罚幸存者方法。在数学推理任务的设计空间研究中,该方法被发现优于其他七种机制。alpha 方法只有一个可调权重,在特定的模型和预算组合上取得了显著成果,突显了最小评分修改比更重的结构性更改更有效。