apache spark agg()函数

Rag*_*hav 2 scala apache-spark-sql

对于示例数据框scholor

scala> scholor.show

| id|  name|age|sal|base|
Run Code Online (Sandbox Code Playgroud)

对于上面,下面两个都给出相同的输出。那么agg()的用途是什么。它只是为了名字。

scala> scholor.groupBy("age").sum("base").show      /*with out agg */

scala> scholor.groupBy("age").agg(sum("base")).show        /* with agg */
Run Code Online (Sandbox Code Playgroud)
scala> scholor.show

| id|  name|age|sal|base|
Run Code Online (Sandbox Code Playgroud)

是否agg()需要任何varargs作为参数?需要什么agg()

提前致谢。

V-L*_*amp 5

为了写.sum这个方法必须存在。它在API上进行了硬编码。使用.agg可以提供其他聚合功能,sum("column")只是其中之一。