Sat*_*ure 7 bigdata apache-spark databricks azure-databricks databricks-sql
我对 Lake House 架构模式了解得越多,并关注 Databricks 的演示,我就几乎看不到任何关于传统数据仓库(Kimball 方法)中的维度建模的讨论。我知道计算和存储要便宜得多,但是如果没有数据建模,查询性能是否会有更大的影响?从 Spark 3.0 开始,我看到了所有很酷的功能,例如自适应查询引擎、动态分区修剪等,但是维度建模是否因此而过时了?如果有人使用 Databricks 实现维度建模,请分享您的想法?
Kimball 的星型模式和 Data Vault 建模技术仍然与 Lakehouse 模式相关,并且提到的优化,例如自适应查询执行、动态分区修剪等,与数据跳过、ZOrder、布隆过滤器等相结合,使查询非常高效。
事实上,Databricks 数据仓库专家最近发表了两篇相关博客文章:
| 归档时间: |
|
| 查看次数: |
2871 次 |
| 最近记录: |