标签: databricks-sql

星型模式(数据建模)仍然与使用 Databricks 的 Lake House 模式相关吗?

我对 Lake House 架构模式了解得越多,并关注 Databricks 的演示,我就几乎看不到任何关于传统数据仓库(Kimball 方法)中的维度建模的讨论。我知道计算和存储要便宜得多,但是如果没有数据建模,查询性能是否会有更大的影响?从 Spark 3.0 开始,我看到了所有很酷的功能,例如自适应查询引擎、动态分区修剪等,但是维度建模是否因此而过时了?如果有人使用 Databricks 实现维度建模,请分享您的想法?

bigdata apache-spark databricks azure-databricks databricks-sql

7
推荐指数
1
解决办法
2871
查看次数

Databricks DELTA CTAS 与使用 %sql 的 LOCATION

DELTA不具有CREATE TABLE LIKE。它确实有CTAS

我只想复制表的定义LOCATION,但还要指定.

例如,这不起作用:

CREATE TABLE IF NOT EXISTS NEW_CUSTOMER_FEED 
AS SELECT * from NEW_CUSTOMER_FEED WHERE 1 = 0 
LOCATION '/atRest/data'
Run Code Online (Sandbox Code Playgroud)

我缺少什么?

databricks delta-lake databricks-sql

6
推荐指数
1
解决办法
3811
查看次数

如何以编程方式获取集群的 JDBC/ODBC 参数?

Databricks 文档展示了如何从 UI 中的 JDBC/ODBC 选项卡获取集群的主机名、端口、HTTP 路径和 JDBC URL 参数。看图片:

Databricks 的 JDBC/ODBC 选项卡
(来源:databricks.com

有没有办法以编程方式获取相同的信息?我的意思是使用 Databricks API 或 Databricks CLI。HTTP path我对包含Workspace Id 的内容特别感兴趣。

jdbc databricks azure-databricks databricks-sql

5
推荐指数
1
解决办法
8843
查看次数

Azure Databricks 中 VIEW 的 OBJECT_DEFINITION

正如标题所述,是否能够object definition使用 Databricks 查询视图SQL,特别是对于 Azure Databricks?

就像使用 SQL Server 时一样,我可以使用函数OBJECT_DEFINITION或存储过程查询视图定义以sp_helptext显示.SELECT statementViews

我查遍了互联网,没有找到对此进行解释的人。也许没有选择?

谢谢。

databricks azure-databricks databricks-sql

5
推荐指数
1
解决办法
7047
查看次数

如何在 Databricks 中使用 OPTIMIZE ZORDER BY

我有两个数据框(来自三角洲湖表),它们通过 id 列进行左连接。

SD1、SD2

%sql
select
    a.columnA,
    b.columnB,
from sd1 a
left outer join sd2 b
on a.id = b.id

   
Run Code Online (Sandbox Code Playgroud)

问题是我的查询需要很长时间,寻找改进结果的方法我找到了OPTIMIZE ZORDER BY Youtube视频

根据视频,如果列将成为where条件的一部分,则在对列进行排序时似乎很有用。

但由于两个数据帧在连接条件中使用 id,因此对该列进行排序是否有趣?

spark.sql(f'OPTIMIZE delta.`{sd1_delta_table_path}` ZORDER BY (id)')
Run Code Online (Sandbox Code Playgroud)

我脑海中遵循的逻辑是,如果我们首先订购该列,那么寻找它们进行匹配所需的时间就会更少。它是否正确 ?

提前致谢

pyspark databricks azure-databricks delta-lake databricks-sql

5
推荐指数
1
解决办法
6659
查看次数

使用 Databricks 删除数据库中的多个表

我正在尝试使用以下命令删除 databrick scala 中的多个表

select 'DROP TABLE ' + tableName from ABC where tableName LIKE 'in%'
Run Code Online (Sandbox Code Playgroud)

错误结果说

SQL 语句错误: AnalysisException:未找到表或视图:ABC

然而 ABC 数据库存在

谢谢

scala databricks databricks-sql

5
推荐指数
1
解决办法
3036
查看次数