在Spark中打印出数据框列的类型

Hue*_*uey 11 pyspark

我尝试在我的Spark数据框架上使用VectorAssembler,它抱怨它不支持StringType类型.我的数据框有2126列.

打印出所有列类型的编程方法是什么?

小智 19

尝试:

>>> for name, dtype in df.dtypes:
...     print(name, dtype)
Run Code Online (Sandbox Code Playgroud)

要么

>>> df.schema
Run Code Online (Sandbox Code Playgroud)


小智 12

df.printSchema() 将以易于遵循的格式为您打印数据框架构