Spark - RelationalGroupedDataset与KeyvalueGroupedDataset?我什么时候应该使用它们?

Tyl*_*归玉门 11 aggregation apache-spark apache-spark-dataset

Dataset在Spark中进行分组时,有两种方法:groupBygroupByKey[K].

groupBy返回RelationalGroupedDataset,同时groupByKey[K]返回KeyvalueGroupedDataset.

它们之间有什么区别?

在什么情况下我应该选择一个而不是另一个?


为什么我的问题是关于"Dataset vs DataFrame"的问题的副本?我不明白.这显然是完全不同的事情!我的问题非常具体而非通用.