使用 python 截断 Databricks 中的增量表

Blu*_*uds 6 python pyspark databricks delta-lake

这里给出了 Python 和 SQL 的 Delta 表删除操作,并给出了使用 SQL 的截断操作。但我找不到Python truncate table 的文档。

Databricks 中的增量表如何实现?

Ale*_*Ott 11

并非所有内容都作为 Python 或 Java/Scala 的函数公开。有些操作仅是 SQL 操作,例如OPTIMIZE。如果你想截断表,你有两种选择:

  1. 使用
spark.sql("TRUNCATE TABLE <name>")
Run Code Online (Sandbox Code Playgroud)

或者

spark.sql("TRUNCATE TABLE delta.`<path>`")
Run Code Online (Sandbox Code Playgroud)
  1. 在覆盖模式下用读+写空数据帧模拟截断:
spark.sql("TRUNCATE TABLE <name>")
Run Code Online (Sandbox Code Playgroud)