Pyspark:选择除特定列之外的所有列

Tsh*_*dau 5 python sql dataframe pyspark

我在PySpark数据框中有大量列,例如200。我想选择除3-4列之外的所有列。如何选择此列,而不必手动输入要选择的所有列的名称?

Tsh*_*dau 7

最后,我满足于以下条件:

  • 掉落

    df.drop('column_1', 'column_2', 'column_3')

  • 选择

    df.select([c for c in df.columns if c not in {'column_1', 'column_2', 'column_3'}])