Pyspark 中是否有等效于 SQL 的 MSCK REPAIR TABLE 的方法

Hen*_*cio 3 hive nosql apache-spark pyspark

在 SQL 中有:

REFRESH TABLE table_name
Run Code Online (Sandbox Code Playgroud)

在 pyspark 中相当于:

spark.refreshTable(table_name)
Run Code Online (Sandbox Code Playgroud)

那么,Pyspark 相当于:

MSCK REPAIR TABLE table_name
Run Code Online (Sandbox Code Playgroud)

Ram*_*ram 6

refreshTable 与 spark session catalog集成。

正如史蒂文所建议的,你可以去 spark.sql('MSCK REPAIR TABLE table_name')

recoverPartitions在上面的链接中有一个叫做(仅适用于分区表,而不适用于视图)的东西。我相信这是 msck repair table. 你可以继续尝试这个..

看到这个ddl.scala似乎与文档相等。
示例用法:

spark.catalog.recoverPartitions(tableName) 
Run Code Online (Sandbox Code Playgroud)

  • 我认为 recoveryPartitions 是我正在寻找的。将测试它并稍后回来确认。 (2认同)