相关疑难解决方法(0)

在pyspark中捕获explain()的结果

在pyspark中，运行：

sdf = sqlContext.sql("""SELECT * FROM t1 JOIN t2 on t1.c1 = t2.c1 """)

进而：

sdf.explain(extended=True)

它打印查询执行的逻辑和物理计划。

我的问题是：如何在变量中捕获输出，而不是打印它？

v = sdf.explain(extended=True) 自然，不起作用

apache-spark pyspark

Bor*_*iev

lucky-day

9
推荐指数

1
解决办法

5237
查看次数

在spark-scala app中将df.show()的内容保存为字符串

我需要将df.show()的输出保存为字符串,以便我可以直接通过电子邮件发送.

例如,下面的例子来自官方的火花文档,:

val df = spark.read.json("examples/src/main/resources/people.json")

// Displays the content of the DataFrame to stdout
df.show()
// +----+-------+
// | age|   name|
// +----+-------+
// |null|Michael|
// |  30|   Andy|
// |  19| Justin|
// +----+-------+

Run Code Online (Sandbox Code Playgroud)

我需要将上表保存为在控制台中打印的字符串.我确实看了log4j来打印日志,但是没有关于仅记录输出的任何信息.

有人可以帮我吗？

log4j scala apache-spark

Omk*_*kar

lucky-day

5
推荐指数

2
解决办法

1754
查看次数