Delta Lake 表上的 SQL 视图

Sri*_*vas 3 apache-spark databricks azure-databricks delta-lake

我需要在 Databricks 中现有的 Delta Lake 表之上创建一个抽象。是否可以在 Spark 中基于 Delta Lake 表制作 SQL Server 类型的 SQL 视图?

Swa*_*ule 5

现在可以通过多种方式在 Delta Lake 上创建 SQL 视图。

  • 通过火花:

CREATE OR REPLACE VIEW sqlView AS SELECT col1, .., coln FROM delta_table

  • 可以在增量表(路径)上创建 Hive 表。只需在 hive 环境中添加 jar,设置以下属性并创建外部表(hive 支持 2.x)

`

ADD JAR /path/to/delta-core-shaded-assembly_2.11-0.1.0.jar;
ADD JAR /path/to/hive-delta_2.11-0.1.0.jar;
SET hive.input.format=io.delta.hive.HiveInputFormat;
SET hive.tez.input.format=io.delta.hive.HiveInputFormat;
CREATE EXTERNAL TABLE deltaTable(col1 INT, col2 STRING)
STORED BY 'io.delta.hive.DeltaStorageHandler'
LOCATION '/delta/table/path'
Run Code Online (Sandbox Code Playgroud)

`

有关更多详细信息: https: //github.com/delta-io/connectors