当我像这样使用DataFrame groupby时:
df.groupBy(df("age")).agg(Map("id"->"count"))
我只会得到一个包含"age"和"count(id)"列的DataFrame,但是在df中,还有许多其他列,例如"name".
总而言之,我希望得到MySQL中的结果,
"按年龄从df组中选择姓名,年龄,计数(id)"
在Spark中使用groupby时我该怎么办?
sql dataframe apache-spark apache-spark-sql
apache-spark ×1
apache-spark-sql ×1
dataframe ×1
sql ×1