Spark Group By Key(Key,List)Pair

解释器认为这是一个带有两个参数的函数。但是，在您的情况下，您有一个参数恰好是一个元组（在这里， aTuple2或 a Pair- 更完整地说，您似乎有一个的列表Pair[Any,List[Any]]）。有几种方法可以解决这个问题。首先，您可以使用表示一对的加糖形式，用一组额外的括号括起来，以表明这是函数的单个预期参数：

((x, y)) => ...

Run Code Online (Sandbox Code Playgroud)

或者，您可以以匹配元组的部分函数的形式编写匿名函数：

groupedData.map( case (k,v) => (k,v(0)) )

Run Code Online (Sandbox Code Playgroud)

最后，您可以根据上次尝试简单地使用单个指定参数，但是 - 意识到它是一个元组 - 引用您需要的元组中的特定字段：

groupedData.map(s => (s._2(0),s._2(1)))  // The key is s._1, and the value list is s._2

Run Code Online (Sandbox Code Playgroud)

归档时间：	9 年，12 月前
查看次数：	23152 次
最近记录：	8 年，9 月前