实体
flash memory
flash memory
PulseAugur coverage of flash memory — every cluster mentioning flash memory across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
0
90 天内 0
层级分布 · 90 天
主题
情绪 · 30 天
2 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
FlashMemory 通过 LSA 将 DeepSeek-V4 KV 缓存减少至 13.5%
研究人员开发了一种名为前瞻稀疏注意力(Lookahead Sparse Attention, LSA)的新技术,该技术显著减少了大型语言模型在处理长上下文时的内存占用。通过训练一个轻量级的神经内存索引器,LSA 仅预测和加载 KV 缓存的关键部分,将内存使用量减少到完整缓存大小的 13.5%。该方法在 DeepSeek-V4 模型上进行了演示,显示 KV 缓存大小有所减小,准确性略有提高。
-
AMD 收购 MEXT 以提高 AI 数据中心的内存效率
AMD 收购了专注于内存分层技术的初创公司 MEXT,以解决数据中心日益增长的内存限制问题,特别是由大型 AI 模型驱动的限制。MEXT 的 AI 驱动的预测内存引擎允许 NAND 闪存充当 DRAM,将不常访问的数据透明地移至更便宜的存储,同时预测未来需求。此次收购旨在提高系统效率,降低数据中心运营商的运营成本,并支持在现有基础设施上部署更大规模的 AI 工作负载。