架构StructType中的Integertype()

Abh*_*tra 1 schema struct dataframe apache-spark pyspark

我正在尝试定义一种架构,以按照以下语法将空白列表转换为数据框:

data=[]

schema = StructType([
StructField("Table_Flag",StringType(),True),
StructField("TableID",IntegerType(),False),
StructField("Entry_No",StringType(),True),
StructField("Dimension_Code",StringType(),True),
StructField("Dimension_Value_Code",StringType(),True)
])

data=spark.createDataFrame(data,schema)
Run Code Online (Sandbox Code Playgroud)

但它给出了错误名称'IntegerType'的定义。我已经尝试过使用BooleanType,DecimalType,FloatType,IntegralType,但是都无法正常工作。只有StringType和DataType可用作数据类型。根据文档类型,在示例中定义了py IntegerType。

请提出建议。我正在使用Spark版本2.0.1

T. *_*ęda 5

在文件的开头添加导入:

from pyspark.sql.types import IntegerType
Run Code Online (Sandbox Code Playgroud)

甚至更简单:

from pyspark.sql.types import *
Run Code Online (Sandbox Code Playgroud)

从导入所有类 pyspark.sql.types