小编sus*_*san的帖子

我spark.read.csv()在 pyspark 中得到了一个数据框。我可以使用df.filter(df['mobile'] == 'Vivo'). 现在，我想按多个值过滤“移动”列。

例如，我有一个band_list=['Apple','Samsung','Vivo']，

我想过滤'mobile'此 band_list 中的值。

我知道一种方法是df.filter((df['mobile'] == 'Apple') | (df['mobile'] == 'Samsung')|(df['mobile'] == 'Vivo'))，但它不灵活。

有人可以告诉我解决这个问题的另一种方法吗？

1
推荐指数

1
解决办法

3429
查看次数

小编sus_san的帖子