小编Aks*_*ita的帖子

_.split("")scala RDD中的更多字段

我正在尝试将数据从一个提取RDD[string]到另一个RDD[string]

RDD包含与此类似的数据:

17.808  15.749  6.649   -0.548  15.9994
Run Code Online (Sandbox Code Playgroud)

我需要将每行的第4和第5个字段相乘并将它们存储为不同的字段RDD[string].

我可以使用以下代码来拉出一个字段

ansRDD = rawRDD(._split(" ")(4)).(_.toFloat)
Run Code Online (Sandbox Code Playgroud)

rawRDD 包含字符串.

但是我需要把两个字段都拉成一个RDD

-0.548  15.9994
Run Code Online (Sandbox Code Playgroud)

这样我就可以做到

answer = ansRDD.foreach(case(a,b) => a*b)
Run Code Online (Sandbox Code Playgroud)

scala apache-spark

1
推荐指数
1
解决办法
748
查看次数

标签 统计

apache-spark ×1

scala ×1