小编vva*_*zza的帖子

迭代数据帧中的每一行，将其存储在 val 中并作为参数传递给 Spark SQL 查询

我试图从查找表（3 行和 3 列）中获取行并逐行迭代并将每行中的值作为参数传递给 SPARK SQL。

DB | TBL   | COL
----------------
db | txn   | ID

db | sales | ID

db | fee   | ID

Run Code Online (Sandbox Code Playgroud)

我在 spark shell 中尝试了一行，它奏效了。但我发现很难遍历行。

val sqlContext = new org.apache.spark.sql.SQLContext(sc)

val db_name:String = "db"

val tbl_name:String = "transaction"

val unique_col:String = "transaction_number"

val dupDf = sqlContext.sql(s"select count(*), transaction_number from $db_name.$tbl_name group by $unique_col having count(*)>1")

Run Code Online (Sandbox Code Playgroud)

请让我知道如何遍历行并作为参数传递？

scala dataframe apache-spark apache-spark-sql

vva*_*zza

2019 08-13

3
推荐指数

1
解决办法

3236
查看次数