小编Lau*_*ren的帖子

如何对pyspark数据框中的列值求和

我在Pyspark工作,并且有一个包含以下各列的数据框。

Q1 = spark.read.csv("Q1final.csv",header = True, inferSchema = True)
Q1.printSchema()

root
|-- index_date: integer (nullable = true)
|-- item_id: integer (nullable = true)
|-- item_COICOP_CLASSIFICATION: integer (nullable = true)
|-- item_desc: string (nullable = true)
|-- index_algorithm: integer (nullable = true)
|-- stratum_ind: integer (nullable = true)
|-- item_index: double (nullable = true)
|-- all_gm_index: double (nullable = true)
|-- gm_ra_index: double (nullable = true)
|-- coicop_weight: double (nullable = true)
|-- item_weight: double (nullable = true)
|-- cpih_coicop_weight: double …
Run Code Online (Sandbox Code Playgroud)

sum dataframe apache-spark pyspark

2
推荐指数
3
解决办法
2万
查看次数

标签 统计

apache-spark ×1

dataframe ×1

pyspark ×1

sum ×1