spark找到最大值和相关密钥

use*_*622 4 python tuples max apache-spark pyspark

我的问题是基于这个问题.我有一个火花对RDD(键,计数)[(a,1), (b,2), (c,1), (d,3)].

如何找到最高计数和实际计数的密钥?

Que*_*det 5

(sc
    .parallelize([("a",1), ("b",5), ("c",1), ("d",3)])
    .max(key=lambda x:x[1]))
Run Code Online (Sandbox Code Playgroud)

('b', 5)不仅会回来5.第一个参数max是用于比较的键(这里是明确的),但是max仍然返回整个值,这里是完整的元组.