实体
MapReduce
MapReduce
PulseAugur coverage of MapReduce — every cluster mentioning MapReduce across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
情绪 · 30 天
1 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
Anyscale 详解 Ray Data 以扩展多模态 AI 数据管道
Anyscale 的博客文章详细介绍了扩展多模态 AI 数据管道所面临的挑战,其中预处理通常会导致 GPU 资源不足,从而造成利用率低下。文章解释说,传统的阶段式批处理执行(涉及在预处理和训练之间将中间数据写入存储)由于显著的 I/O 成本和延迟而效率低下。文章提出了一种使用 Ray Data 的分离式流式架构,将预处理后的数据直接从专用的预处理集群流式传输到 GPU 工作节点,绕过存储瓶颈并提高 GPU 利用率。
-
Designing Data-Intensive Applications: The Cloud & Doing the Right Thing
Martin Kleppmann 和 Chris Riccomini 的《设计数据密集型应用》第二版更新了 2016 年的权威著作,以反映云计算的广泛采用。这一修订版探讨了云服务与自托管之间的权衡,强调了软件工程师的道德考量。作者们借鉴了他们丰富的经验,为在现代技术格局中构建弹性系统提供了见解。