小编HKS*_*HKS的帖子

如何使用 pyspark 读取 Parquet 文件、更改数据类型并写入 Hadoop 中的另一个 Parquet 文件

我的源镶木地板文件的所有内容都是字符串。我的目标 parquet 文件需要将其转换为不同的数据类型,如 int、字符串、日期等。我该如何执行此操作?

python hadoop apache-spark pyspark

5
推荐指数
1
解决办法
2万
查看次数

标签 统计

apache-spark ×1

hadoop ×1

pyspark ×1

python ×1