Tha*_*ise 1 pyspark spark-dataframe pyspark-sql
我在 Pyspark 中有一个 DataFrame,我需要选择其中 id 值出现在数组中的行。有人可以帮我吗?
例子:
+---+-----+
| id| col2|
+---+-----+
|123| 2 |
|245| 32 |
| 12| 34 |
|234| 1 |
+---+-----+
Run Code Online (Sandbox Code Playgroud)
数组:[123, 12, 234]
想要的结果:
+---+-----+
| id| col2|
+---+-----+
|123| 2 |
| 12| 34 |
|234| 1 |
+---+-----+
Run Code Online (Sandbox Code Playgroud)
你可以用isin与filter:
ids = [123, 12, 234]
df.filter(df.id.isin(ids)).show()
+---+----+
| id|col2|
+---+----+
|123| 2|
| 12| 34|
|234| 1|
+---+----+
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
5140 次 |
| 最近记录: |