实体
data lake
data lake
PulseAugur coverage of data lake — every cluster mentioning data lake across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
0
90 天内 0
层级分布 · 90 天
主题
情绪 · 30 天
1 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
Databricks 概述现代数据管道架构和部署的最佳实践
Databricks 发布了一份关于数据管道最佳实践的综合指南,涵盖了架构、现代管道设计和部署策略。该指南强调了深思熟虑的架构选择对于可靠性和成本效益的重要性,包括在批处理和流式处理模式之间进行选择以及优化存储。它还强调了版本控制、CI/CD 和全面的监控等强大的运营实践对于生产就绪的必要性。
-
数据湖与云数据仓库:选择正确的架构
本指南比较了数据湖和云数据仓库架构,重点介绍了它们在数据存储、查询性能、治理和成本方面的差异。数据湖因其读时模式(schema-on-read)方法和低成本对象存储,非常适合存储用于机器学习和高级分析的原始、多格式数据。相反,云数据仓库针对结构化数据和用于商业智能的高并发SQL查询进行了优化,采用写时模式(schema-on-write)方法。数据湖仓(Data lakehouses)被提出为一种解决方案,它结合了两者优点,在数据湖存…