小编Vic*_*ter的帖子

如何将RDD [Row]转换为RDD [String]

我有一个名为source的DataFrame,一个来自mysql的表

val source = sqlContext.read.jdbc(jdbcUrl, "source", connectionProperties)
Run Code Online (Sandbox Code Playgroud)

我已将它转换为rdd

val sourceRdd = source.rdd
Run Code Online (Sandbox Code Playgroud)

但是它的RDD [Row]我需要RDD [String]来进行转换

source.map(rec => (rec.split(",")(0).toInt, rec)), .subtractByKey(), etc..
Run Code Online (Sandbox Code Playgroud)

谢谢

scala apache-spark

4
推荐指数
1
解决办法
8687
查看次数

如何将Array [String]存储到输出文件

我有一个名为samparr的Array [String],其中包含一些值,我希望将其存储为输出文件。

var samparr: Array[String] = new Array[String](4)
samparr +:= print1 + "  BEST_MATCH  " + print2
Run Code Online (Sandbox Code Playgroud)

就像,

val output = samparr.saveAsTextFile(outputpath)
Run Code Online (Sandbox Code Playgroud)

但不是RDD,而是一个Array [String]

scala apache-spark

3
推荐指数
1
解决办法
7442
查看次数

标签 统计

apache-spark ×2

scala ×2