PulseAugur
实时 00:56:37
实体 Apache DataSketches

Apache DataSketches

PulseAugur coverage of Apache DataSketches — every cluster mentioning Apache DataSketches across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
0
90 天内 0
层级分布 · 90 天
关系
最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_09621 ·

    Databricks 推出草图函数,加速大数据集分析

    Databricks 推出了四种新的草图函数,旨在显著加速分析查询。这些函数基于 Apache DataSketches 构建,通过使用具有可配置相对误差 1-2% 的有界内存近似,能够更快地计算百分位数、唯一计数和 Top-K 项。与精确计算相比,这种方法可以将计算时间和内存使用量减少几个数量级。通过允许在不重新处理原始数据的情况下存储、合并和重新查询草图,这些新功能还有助于实现实时分析,例如受众重叠分析和趋势排行榜。