小编Car*_*ues的帖子

是否可以在 pyspark 中转换数据帧的多列?

我有一个多列 pyspark 数据框,我需要将字符串类型转换为正确的类型,例如:

我目前正在这样做

df = df.withColumn(col_name, col(col_name).cast('float') \
.withColumn(col_id, col(col_id).cast('int') \
.withColumn(col_city, col(col_city).cast('string') \
.withColumn(col_date, col(col_date).cast('date') \
.withColumn(col_code, col(col_code).cast('bigint')
Run Code Online (Sandbox Code Playgroud)

是否可以创建一个包含类型的列表并将其立即传递到所有列?

python apache-spark apache-spark-sql pyspark

4
推荐指数
1
解决办法
2488
查看次数

标签 统计

apache-spark ×1

apache-spark-sql ×1

pyspark ×1

python ×1