相关疑难解决方法(0)

使用类似SQL的IN子句过滤Pyspark DataFrame

我想用类似SQL的IN子句过滤Pyspark DataFrame ,如

sc = SparkContext()
sqlc = SQLContext(sc)
df = sqlc.sql('SELECT * from my_df WHERE field1 IN a')
Run Code Online (Sandbox Code Playgroud)

a元组在哪里(1, 2, 3).我收到此错误:

java.lang.RuntimeException:[1.67]失败:``('''',但是找到了标识符

这基本上是说它期待类似'(1,2,3)'而不是a.问题是我不能手动写入a中的值,因为它是从另一个作业中提取的.

在这种情况下我该如何过滤?

python sql dataframe apache-spark pyspark

37
推荐指数
4
解决办法
5万
查看次数

标签 统计

apache-spark ×1

dataframe ×1

pyspark ×1

python ×1

sql ×1