如何使用互斥键连接两个RDD

Met*_*est 0 python scala apache-spark

假设我有两个具有以下值的Spark RDD

x = [(1, 3), (2, 4)]
Run Code Online (Sandbox Code Playgroud)

y = [(3, 5), (4, 7)]
Run Code Online (Sandbox Code Playgroud)

而我想拥有

z = [(1, 3), (2, 4), (3, 5), (4, 7)]
Run Code Online (Sandbox Code Playgroud)

我怎样才能做到这一点.我知道你可以使用outerJoin然后使用map来实现这一点,但是有更直接的方法.

maa*_*asg 6

rdd.union(otherRDD) 为您提供问题中预期的两个rdds的联合

x.union(y)