如何计算pyspark数据框中一列中每个分类变量的频率?

ver*_*ley 1 python pyspark spark-dataframe

假设我有一个pyspark数据框:

df.show()
+-----+---+
|  x  |  y|
+-----+---+
|alpha|  1|
|beta |  2|
|gamma|  1|
|alpha|  2|
+-----+---+
Run Code Online (Sandbox Code Playgroud)

我想计算发生的次数alphabeta并且gamma在栏中有x。如何在pyspark中做到这一点?