删除以.开头的列

Question

我有一个包含多列的数据框,例如:

        Prod_A       Prod_B        Prod_C        State         Region
1          1           0             1             1              1

我想删除所有以Prod_开头的列,(我不能选择或按名称删除,因为数据框有200个变量)是否可以这样做？

谢谢

Answer 1

使用startswith的面具,然后删除列与loc和boolean indexing:

df = df.loc[:, ~df.columns.str.startswith('Prod')]
print (df)
   State  Region
1      1       1

Answer 2

首先，选择要删除的所有列：

unwanted = df.columns[df.columns.str.startswith('Prod_')]

，全部删除：

df.drop(unwanted, axis=1, inplace=True)

Answer 3

我们也可以使用负正则表达式：

In [269]: df.filter(regex=r'^(?!Prod_).*$')
Out[269]:
   State  Region
1      1       1