Luc*_*chi 5 python pyspark spark-dataframe pyspark-sql
我想对 pyspark 数据框进行分组并计算特定列的方差。对于平均而言,这很容易,可以像这样完成
from pyspark.sql import functions as func
AVERAGES=df.groupby('country').agg(func.avg('clicks').alias('avg_clicks')).collect()
Run Code Online (Sandbox Code Playgroud)
但是对于方差,函数子模块中似乎没有任何聚合函数(我也想知道为什么,因为这是一个非常常见的操作)
| 归档时间: |
|
| 查看次数: |
13116 次 |
| 最近记录: |