相关疑难解决方法(0)

有没有办法将Spark的Dataset.show()方法的输出作为字符串?

Spark Dataset.show()方法对于查看数据集的内容非常有用,特别是对于调试(它打印出格式良好的表).据我所知,它只打印到控制台,但能够将其作为一个字符串.例如,能够将其写入日志,或者在使用IntelliJ进行调试时将其视为表达式的结果会很好.

有没有办法得到Dataset.show()字符串的输出?

apache-spark apache-spark-sql

6
推荐指数
1
解决办法
1694
查看次数

将DataFrame show()的结果保存到pyspark中的字符串

我想在pyspark中捕获show的结果,类似于此处此处。我无法使用pyspark找到解决方案,只能使用scala。

df.show()
#+----+-------+
#| age|   name|
#+----+-------+
#|null|Michael|
#|  30|   Andy|
#|  19| Justin|
#+----+-------+
Run Code Online (Sandbox Code Playgroud)

最终目的是将其捕获为logger.info 我尝试过的字符串logger.info(df.show()),仅在控制台上显示。

python apache-spark apache-spark-sql pyspark

4
推荐指数
1
解决办法
956
查看次数

标签 统计

apache-spark ×2

apache-spark-sql ×2

pyspark ×1

python ×1