在pyspark中,运行:
sdf = sqlContext.sql("""SELECT * FROM t1 JOIN t2 on t1.c1 = t2.c1 """)
进而:
sdf.explain(extended=True)
它打印查询执行的逻辑和物理计划。
我的问题是:如何在变量中捕获输出,而不是打印它?
v = sdf.explain(extended=True) 自然,不起作用
v = sdf.explain(extended=True)
apache-spark pyspark
apache-spark ×1
pyspark ×1