相关疑难解决方法(0)

如何在Spark SQL中找到分组Vector列的平均值?

RelationalGroupedDataset通过调用创建了一个instances.groupBy(instances.col("property_name")):

val x = instances.groupBy(instances.col("property_name"))
Run Code Online (Sandbox Code Playgroud)

如何组合用户定义的聚合函数来对每个组执行Statistics.colStats().mean

谢谢!

aggregate-functions user-defined-functions apache-spark apache-spark-sql apache-spark-ml

5
推荐指数
1
解决办法
2327
查看次数