我有三个字符串类型的数组包含以下信息:
我正在尝试使用spark数据帧来实现这一目标.Spark数据框提供了agg(),您可以在其中传递Map [String,String](列名和相应的聚合操作)作为输入,但是我想对数据的同一列执行不同的聚合操作.有关如何实现这一目标的任何建议?
我有两个RDD,一个(a, b, a, c, b, c, a)和另一个 - 配对的RDD ((a, 0), (b, 1), (c, 2)).
我想分别用0,1,2(分别是第二个RDD中的键a,b,c的值)替换a第一个RDD中的s,bs和cs.我想在第一个RDD中保留事件的顺序.
如何在Spark中实现它?