use*_*622 4 python tuples max apache-spark pyspark
我的问题是基于这个问题.我有一个火花对RDD(键,计数)[(a,1), (b,2), (c,1), (d,3)].
如何找到最高计数和实际计数的密钥?
(sc
.parallelize([("a",1), ("b",5), ("c",1), ("d",3)])
.max(key=lambda x:x[1]))
Run Code Online (Sandbox Code Playgroud)
('b', 5)不仅会回来5.第一个参数max是用于比较的键(这里是明确的),但是max仍然返回整个值,这里是完整的元组.
| 归档时间: |
|
| 查看次数: |
2343 次 |
| 最近记录: |