ver*_*ley 1 python pyspark spark-dataframe
假设我有一个pyspark数据框:
df.show()
+-----+---+
| x | y|
+-----+---+
|alpha| 1|
|beta | 2|
|gamma| 1|
|alpha| 2|
+-----+---+
Run Code Online (Sandbox Code Playgroud)
我想计算发生的次数alpha,beta并且gamma在栏中有x。如何在pyspark中做到这一点?
用途pyspark.sql.DataFrame.cube():
df.cube("x").count().show()
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
2946 次 |
| 最近记录: |