带有初始值的 zipWithIndex rdd

a.m*_*ssa 1 scala apache-spark rdd

我有一个这样的RDD:

+----------+--------+
|firstName |lastName|
+----------+--------+
|      john|   smith|
|      anna|  tourde|
+----------+--------+
Run Code Online (Sandbox Code Playgroud)

我想创建一个新列,就像我们可以用 zipWithIndex 做的那样,但初始值为 8。

+----------+--------+-----+
|firstName |lastName|index|
+----------+--------+-----+
|      john|   smith|    8|
|      anna|  tourde|    9|
+----------+--------+-----+
Run Code Online (Sandbox Code Playgroud)

你有什么主意吗?谢谢

Vit*_*nko 6

rdd.zipWithIndex().map { case (v, ind) =>
  (v, ind + 8)
}
Run Code Online (Sandbox Code Playgroud)