我在println行中收到错误消息SPARK-5063
val d.foreach{x=> for(i<-0 until x.length)
println(m.lookup(x(i)))}
Run Code Online (Sandbox Code Playgroud)
d是 RDD[Array[String]] m RDD[(String, String)].有没有办法以我想要的方式打印?或者我如何将d转换RDD[Array[String]] 为Array[String]?
我正在尝试在使用spark时获得特定获胜拍卖时间周围的拍卖列表的过滤列表.获胜拍卖RDD和完整拍卖DD由案例类组成,格式如下:
case class auction(id: String, prodID: String, timestamp: Long)
我想在相同的产品ID上过滤在中奖拍卖的10秒内拍卖的完整拍卖RDD,并获得充满这些的RDD.
我试图像这样过滤它:
val specificmessages = winningauction.map(it =>
allauctions.filter( x =>
x.timestamp > it.timestamp - 10 &&
x.timestamp < it.timestamp + 10 &&
x.productID == it.productID
)
)
Run Code Online (Sandbox Code Playgroud)
有没有办法执行此操作,因为嵌套转换是不可能的?
还有另一个答案,但这主要涉及嵌套地图SPARK-5603嵌套地图功能