相关疑难解决方法(0)

使用Spark DataFrame groupby时如何获取其他列?

当我像这样使用DataFrame groupby时:

df.groupBy(df("age")).agg(Map("id"->"count"))
Run Code Online (Sandbox Code Playgroud)

我只会得到一个包含"age"和"count(id)"列的DataFrame,但是在df中,还有许多其他列,例如"name".

总而言之,我希望得到MySQL中的结果,

"按年龄从df组中选择姓名,年龄,计数(id)"

在Spark中使用groupby时我该怎么办?

sql dataframe apache-spark apache-spark-sql

29
推荐指数
3
解决办法
3万
查看次数

标签 统计

apache-spark ×1

apache-spark-sql ×1

dataframe ×1

sql ×1