我有一个带有3k-4k列的Spark数据框,我想删除名称符合某些可变条件的列。其中ColumnName喜欢' foo '。
要获取列名,请使用df.columns并drop()支持在一个调用中删除许多列。下面的代码使用了这两个,并满足您的需要:
condition = lambda col: 'foo' in col
new_df = df.drop(*filter(condition, df.columns))
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
1762 次 |
| 最近记录: |