Databricks 推出了一个 Beta 功能,允许 Apache Spark、Flink 和 DuckDB 等外部引擎创建、读取和写入 Unity Catalog 管理的 Delta 表。此扩展基于 Unity Catalog 的开放 API,旨在消除数据孤岛并降低冗余存储成本。新功能利用 Delta Lake 的 catalog commits 来实现事务安全和可审计性,同时还支持流式操作和自动数据优化。 AI
影响 通过允许更多工具访问受治理的数据,增强了 AI/ML 工作负载的数据互操作性。
排序理由 现有数据平台功能的更新。
- Alex Jiang
- Apache Spark
- Confluent Tableflow
- Databricks
- Delta Kernel
- Delta Lake
- Delta tables
- DuckDB
- Flink
- Tathagata Das
- Unity Catalog
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →