我想把这个从R改写为Pyspark,有什么好看的建议吗?
array <- c(1,2,3)
dataset <- filter(!(column %in% array))
Run Code Online (Sandbox Code Playgroud)
Rya*_*ier 50
在pyspark你可以这样做:
array = [1, 2, 3]
dataframe.filter(dataframe.column.isin(*array) == False)
Run Code Online (Sandbox Code Playgroud)
LaS*_*Sul 20
以运算符〜表示相反:
df_filtered = df.filter(~df["column_name"].isin([1, 2, 3]))
Run Code Online (Sandbox Code Playgroud)
小智 10
df_result = df[df.column_name.isin([1, 2, 3]) == False]
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
34708 次 |
| 最近记录: |