我RelationalGroupedDataset
通过调用创建了一个instances.groupBy(instances.col("property_name"))
:
val x = instances.groupBy(instances.col("property_name"))
Run Code Online (Sandbox Code Playgroud)
如何组合用户定义的聚合函数来对每个组执行Statistics.colStats().mean?
谢谢!
aggregate-functions user-defined-functions apache-spark apache-spark-sql apache-spark-ml
apache-spark ×1