小编sus*_*san的帖子

如何通过pyspark数据框中的多个值查询一列?

spark.read.csv()在 pyspark 中得到了一个数据框。我可以使用df.filter(df['mobile'] == 'Vivo'). 现在,我想按多个值过滤“移动”列。

例如,我有一个band_list=['Apple','Samsung','Vivo']

我想过滤'mobile'此 band_list 中的值。

我知道一种方法是df.filter((df['mobile'] == 'Apple') | (df['mobile'] == 'Samsung')|(df['mobile'] == 'Vivo')),但它不灵活。

有人可以告诉我解决这个问题的另一种方法吗?

python dataframe apache-spark pyspark

1
推荐指数
1
解决办法
3429
查看次数

标签 统计

apache-spark ×1

dataframe ×1

pyspark ×1

python ×1