PulseAugur
实时 08:03:54
实体 Compute Express Link

Compute Express Link

PulseAugur coverage of Compute Express Link — every cluster mentioning Compute Express Link across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
5
90 天内 5
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
情绪 · 30 天

2 天有情绪数据

最近 · 第 1/1 页 · 共 5 条
  1. TOOL · CL_45782 ·

    Reddit用户使用768GB二手Optane内存运行1万亿参数LLM

    一位Reddit用户通过利用768GB的二手Intel Optane持久内存模块作为RAM,成功在一台单GPU工作站上本地运行了一个1万亿参数的LLM,具体为Kimi K2.5。该设置实现了每秒约4个token的性能,考虑到硬件的预算限制,这被认为是一个令人印象深刻的性能。已停产Optane DIMM的使用突显了为大型语言模型推理提供经济实惠、大容量内存解决方案的潜在市场缺口,尤其是在DRAM价格波动的情况下。

  2. RESEARCH · CL_42400 ·

    AI memory bottleneck spurs HBM, CXL, and specialized chip innovations

    The AI industry is grappling with a significant 'memory wall' bottleneck, where GPU processing power outstrips memory bandwidth and capacity. This challenge is exacerbated by the increasing demands of training large gen…

  3. COMMENTARY · CL_25092 ·

    AI memory crunch spurs interest in CXL; OSes add AI support

    The Register reports on potential solutions to the AI-driven memory crunch, highlighting Compute Express Link (CXL) as a technology that could alleviate the strain on system RAM. The article also touches on broader AI-r…

  4. RESEARCH · CL_13427 ·

    DeepSeek 的 V4 模型省略了 Engram 记忆模块,引发了讨论和新研究

    DeepSeek 最新的 V4 模型显著省略了 Engram,这是一个与北京大学共同开发的创新记忆和效率模块。Engram 的设计目的是通过允许直接知识查找而不是重新计算静态信息来增强 Transformer,人们曾预计它将成为 V4 的基础组成部分。尽管 Engram 未包含在 V4 中,但其原理正在后续研究中被探索,包括用于多机部署的 CXL 内存池、其哈希机制的实验验证以及向视觉模态的适应。

  5. SIGNIFICANT · CL_09990 ·

    英韧科技吴资宁谈AI SSD如何将闲置算力转化为有效算力。

    在AI时代,存储正从单纯的数据载体向影响算力的关键环节转变。英韧科技董事长吴资宁指出,AI SSD通过优化数据组织和调度,是实现闲置算力向有效算力转化的关键。公司正开发差异化的AI SSD解决方案,包括面向训练的Dongting-N3、面向容量敏感场景的N3Q以及面向低延迟推理的N3X,以满足AI工作负载的多样化需求。