实体 Compute Express Link

Compute Express Link

PulseAugur coverage of Compute Express Link — every cluster mentioning Compute Express Link across labs, papers, and developer communities, ranked by signal.

总计 · 30天

2

90 天内 8

发布 · 30天

0

90 天内 0

论文 · 30天

0

90 天内 1

层级分布 · 90 天

research 1
tool 6
commentary 1

主题

情绪 · 30 天

2 天有情绪数据

最近 · 第 1/1 页 · 共 8 条

RESEARCH · CL_149684 · Jul 18 · 10:07

AI 存储和内存解决方案通过新合作和技术取得进展

多家公司正在宣布 AI 存储和内存解决方案的进展，以满足日益增长的 AI 工作负载需求。Backblaze 和 CoreWeave 已合作提供经济高效的 AI 基础设施存储，优化跨性能层级的数据放置。Panmnesia 展示了 CXL 内存扩展技术，Meta 已部署该技术，将 AI 推理的服务器需求减少多达 25%，并提高响应时间。此外，Cloudera 和 Vast Data 正在合作提供统一的 AI 数据平台，该平台利用 NVID…
RESEARCH · CL_109406 · Jun 25 · 00:40

SNIA 推出 MRAM SIG 以标准化接口并促进采用

存储网络工业协会 (SNIA) 成立了磁阻随机存取存储器 (MRAM) 特别兴趣小组 (SIG)，以促进 MRAM 的采用。该小组旨在标准化 MRAM 技术并开发新接口，以简化实施，特别是在人工智能、汽车和数据中心应用领域。SIG 正在与 IEEE 标准协会合作，解决对磁场敏感性的担忧，并致力于制定 JEDEC 标准，使 MRAM 能够与 LPDDR 和 CXL 等现有内存接口无缝集成，从而可能在包括 chiplets 在内的各种架构…
RESEARCH · CL_59618 · May 29 · 12:00

AI芯片初创公司XCENA为其以内存为中心的架构筹集了1.35亿美元

专注于AI基础设施的初创公司XCENA已以5.7亿美元的估值完成了1.35亿美元的B轮融资。该公司正在开发一种新的芯片架构，旨在通过将计算能力置于DRAM附近来缓解AI的内存瓶颈。这种方法通过减少CPU、GPU和内存之间的数据传输效率低下，有可能显著降低超大规模用户的AI基础设施成本。
TOOL · CL_45782 · May 23 · 11:20

Reddit用户使用768GB二手Optane内存运行1万亿参数LLM

一位Reddit用户通过利用768GB的二手Intel Optane持久内存模块作为RAM，成功在一台单GPU工作站上本地运行了一个1万亿参数的LLM，具体为Kimi K2.5。该设置实现了每秒约4个token的性能，考虑到硬件的预算限制，这被认为是一个令人印象深刻的性能。已停产Optane DIMM的使用突显了为大型语言模型推理提供经济实惠、大容量内存解决方案的潜在市场缺口，尤其是在DRAM价格波动的情况下。
RESEARCH · CL_42400 · May 21 · 09:00

AI内存瓶颈推动HBM、CXL和专用芯片创新

人工智能行业正面临一个显著的“内存墙”瓶颈，即GPU处理能力超过了内存带宽和容量。训练大型生成式AI模型日益增长的需求以及边缘推理和智能体AI日益增长的需求加剧了这一挑战。高带宽内存（HBM）、Compute Express Link（CXL）以及专用处理器SRAM网格等解决方案正在被开发以解决这些限制，尽管它们也带来了供应、成本和热管理方面的新挑战。
COMMENTARY · CL_25092 · May 10 · 14:00

AI内存危机促使CXL受关注；操作系统增加AI支持

The Register 报道了AI驱动的内存危机潜在解决方案，强调了计算表达链接（CXL）作为一项可能缓解系统RAM压力的技术。文章还涉及更广泛的AI相关新闻，包括Fedora和Ubuntu操作系统即将推出的AI支持，以及Google调整Chrome的AI隐私设置以在设备上进行处理。
RESEARCH · CL_13427 · May 3 · 03:43

DeepSeek 的 V4 模型省略了 Engram 记忆模块，引发了讨论和新研究

DeepSeek 最新的 V4 模型显著省略了 Engram，这是一个与北京大学共同开发的创新记忆和效率模块。Engram 的设计目的是通过允许直接知识查找而不是重新计算静态信息来增强 Transformer，人们曾预计它将成为 V4 的基础组成部分。尽管 Engram 未包含在 V4 中，但其原理正在后续研究中被探索，包括用于多机部署的 CXL 内存池、其哈希机制的实验验证以及向视觉模态的适应。
SIGNIFICANT · CL_09990 · Apr 30 · 01:51

英韧科技吴资宁谈AI SSD如何将闲置算力转化为有效算力。

在AI时代，存储正从单纯的数据载体向影响算力的关键环节转变。英韧科技董事长吴资宁指出，AI SSD通过优化数据组织和调度，是实现闲置算力向有效算力转化的关键。公司正开发差异化的AI SSD解决方案，包括面向训练的Dongting-N3、面向容量敏感场景的N3Q以及面向低延迟推理的N3X，以满足AI工作负载的多样化需求。