Tyl*_*归玉门 11 aggregation apache-spark apache-spark-dataset
Dataset在Spark中进行分组时,有两种方法:groupBy和groupByKey[K].
groupBy返回RelationalGroupedDataset,同时groupByKey[K]返回KeyvalueGroupedDataset.
它们之间有什么区别?
在什么情况下我应该选择一个而不是另一个?
为什么我的问题是关于"Dataset vs DataFrame"的问题的副本?我不明白.这显然是完全不同的事情!我的问题非常具体而非通用.
| 归档时间: |
|
| 查看次数: |
478 次 |
| 最近记录: |