我是Spark和Scala的新手.我对reduceByKey函数在Spark中的工作方式感到困惑.假设我们有以下代码:
val lines = sc.textFile("data.txt")
val pairs = lines.map(s => (s, 1))
val counts = pairs.reduceByKey((a, b) => a + b)
Run Code Online (Sandbox Code Playgroud)
map函数是明确的:s是键,它指向行,data.txt而1是值.
但是,我没有得到reduceByKey如何在内部工作?"a"指向钥匙吗?或者,"a"指向"s"吗?那么什么代表a + b?它们是如何填满的?
我想在一个'detached'条形图中绘制多个堆叠条形图.例如,想象一下这个条形图,但堆叠,而不是一个单一的颜色.
