Abh*_*tra 1 schema struct dataframe apache-spark pyspark
我正在尝试定义一种架构,以按照以下语法将空白列表转换为数据框:
data=[]
schema = StructType([
StructField("Table_Flag",StringType(),True),
StructField("TableID",IntegerType(),False),
StructField("Entry_No",StringType(),True),
StructField("Dimension_Code",StringType(),True),
StructField("Dimension_Value_Code",StringType(),True)
])
data=spark.createDataFrame(data,schema)
Run Code Online (Sandbox Code Playgroud)
但它给出了错误名称'IntegerType'的定义。我已经尝试过使用BooleanType,DecimalType,FloatType,IntegralType,但是都无法正常工作。只有StringType和DataType可用作数据类型。根据文档类型,在示例中定义了py IntegerType。
请提出建议。我正在使用Spark版本2.0.1
在文件的开头添加导入:
from pyspark.sql.types import IntegerType
Run Code Online (Sandbox Code Playgroud)
甚至更简单:
from pyspark.sql.types import *
Run Code Online (Sandbox Code Playgroud)
从导入所有类 pyspark.sql.types
| 归档时间: |
|
| 查看次数: |
4599 次 |
| 最近记录: |