PySpark reduceByKey在多个值上

Kil*_*ail 1 pyspark

如果我有一对K,V对,例如:

(K, (v1, v2))
(K, (v3, v4))
Run Code Online (Sandbox Code Playgroud)

如何总结我得到的值 (k, (v1 + v3, v2 + v4))

Lok*_* R. 6

reduceByKey支持功能。可以说A是键值对的数组。

output = A.reduceByKey(lambda x, y: x[0]+y[0], x[1]+y[1])
Run Code Online (Sandbox Code Playgroud)