Dan*_*rty 5 python dataframe python-3.x pandas
给定以下数据框:
import pandas as pd
import numpy as np
DF = pd.DataFrame({'COL1': ['a','b','b'],
'COL2' : [0,np.nan,1],})
DF
COL1 COL2
0 a 0
1 b NaN
2 b 1
Run Code Online (Sandbox Code Playgroud)
我希望能够指定一个新列COL3具有的价值2的所有行上COL1是b和COL2不为空。
期望的结果如下:
COL1 COL2 COL3
0 a 0 0
1 b NaN 0
2 b 1 2
Run Code Online (Sandbox Code Playgroud)
提前致谢!
这可以使用DataFrame 上的apply方法来实现。您需要传入一个函数来应用于每一行,并将轴1设置为正确的模式(应用于每一行,而不是每一列)。
这是一个工作示例:
def row_handler(row):
if row['COL1'] == 'b' and not np.isnan(row['COL2']):
return 2
return 0
DF['COL3'] = DF.apply(row_handler, axis=1)
Run Code Online (Sandbox Code Playgroud)
返回这个:
>> print DF
COL1 COL2 COL3
0 a 0 0
1 b NaN 0
2 b 1 2
Run Code Online (Sandbox Code Playgroud)
numpy.where您可以与isin和 一起使用notnull:
DF['COL3'] = np.where((DF['COL1'].isin(['b'])) &(DF['COL2'].notnull()), 2, 0)
print DF
COL1 COL2 COL3
0 a 0 0
1 b NaN 0
2 b 1 2
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
3117 次 |
| 最近记录: |