pyspark 数据框、分组和计算列的方差

Luc*_*chi 5 python pyspark spark-dataframe pyspark-sql

我想对 pyspark 数据框进行分组并计算特定列的方差。对于平均而言,这很容易,可以像这样完成

from pyspark.sql import functions as func
AVERAGES=df.groupby('country').agg(func.avg('clicks').alias('avg_clicks')).collect()
Run Code Online (Sandbox Code Playgroud)

但是对于方差,函数子模块中似乎没有任何聚合函数(我也想知道为什么,因为这是一个非常常见的操作)