Ant*_*ead 4 python mask multiple-columns dataframe pandas
我期待运用乘法口罩上一个大熊猫数据集的每一列(分别于它的属性)的蟒蛇.在下一步中,我想在数据框中找到(a)符合所有条件的行.因此我有:
df
Out[27]:
DE FL GA IA ID
0 0 1 0 0 0
1 1 0 1 0 1
2 0 0 1 0 0
3 0 1 0 0 0
4 0 0 0 0 0
mask_list = []
for i in range(0,5):
if i % 2==0:
mask_list.append(df[[i]]>0)
else:
mask_list.append(df[[i]]<1)
concat_frame = pa.DataFrame()
for mask in mask_list:
concat_frame =pa.concat((concat_frame, mask), axis=1)
concat_frame
Out[48]:
DE FL GA IA ID
0 False False False True False
1 True True True True True
2 False True True True False
3 False False False True False
4 False True False True False
[5 rows x 5 columns]
Run Code Online (Sandbox Code Playgroud)
更新
预期结果:
outcome
Out[60]:
DE FL GA IA ID
1 1 0 1 0 1
Run Code Online (Sandbox Code Playgroud)
这里有一个问题:
如何在df上应用concat_mask,以便我选择所有布尔条件匹配的行(是True)?
您可以使用pandas all方法和布尔逻辑.正如EdChum评论的那样,我对你的确切例子还有点不清楚,但类似的例子是
In [1]: df = DataFrame([[1,2],[-3,5]], index=[0,1], columns=['a','b'])
In [2]: df
Out [2]:
a b
0 1 2
1 -3 5
In [3]: msk = (df>1) & (df<5)
In [4]: msk
Out [4]:
a b
0 False True
1 False False
In [5]: msk.all(axis=1)
Out [5]:
0 False
1 False
dtype: bool
Run Code Online (Sandbox Code Playgroud)
如果您想通过掩码索引原始数据帧,则可以执行此操作
In [6]: df[msk]
Out [6]:
a b
0 NaN 2
1 NaN NaN
Run Code Online (Sandbox Code Playgroud)
或者您最初指出所有行都为真的行
In [7]: idx = msk.all(axis=1)
In [8]: df[idx]
Out [8]:
Empty DataFrame
Columns: [a,b]
Index: []
Run Code Online (Sandbox Code Playgroud)
或者如果一行是真的
In [9]: idx[0] = True
In [10]: df[idx]
Out [10]:
a b
0 1 2
Run Code Online (Sandbox Code Playgroud)
编辑:只是在评论澄清之后解决原始问题,我们需要针对不同列的不同过滤标准
In [10]: msk1 = df[['a']] < 0
In [11]: msk2 = df[['b']] > 3
In [12]: msk = concat((msk1, msk2), axis=1)
In [12]: slct = msk.all(axis=1)
In [13]: df.ix[slct]
Out [13]:
a b
1 -3 5
Run Code Online (Sandbox Code Playgroud)