Zek*_*eke 1 python if-statement count pandas
我有一个包含整数和NaN的数据帧.我几乎要创建一个countif语句,它将迭代一行中的每个值并计算大于0的值.
这是一个示例df:
d = {'col1': [1, "", 5, 0], 'col2': [3, 4, "", 7], 'col3': [2, 8, "", 3]}
df = pd.DataFrame(data=d)
df = df.convert_objects(convert_numeric = True)
df
Out[356]:
col1 col2 col3
0 1.0 3.0 2.0
1 NaN 4.0 8.0
2 5.0 NaN NaN
3 0.0 7.0 3.0
Run Code Online (Sandbox Code Playgroud)
我一直在使用下面的函数来计算不是NaN的值,但是我想在此上设置一个条件(大于0而不是NaN).
df.apply(lambda x: x.count(), axis = 1)
Out[357]:
0 3
1 2
2 1
3 3
dtype: int64
Run Code Online (Sandbox Code Playgroud)
如果有人可以提供关于如何根据某个非常有用的条件连续计算值的建议,请提前感谢.
Pandas允许您广播比较器,因此df>0创建一个数据帧,其中每个条目都是一个布尔值,根据相应的条目df是否大于0(并且这也照顾NaN,因为np.nan > 0被评估为False).该sum方法然后胁迫True到1和False到0并发现总.由于您需要行总计,因此您需要轴1.所以:
(df>0).sum(axis=1)