我有一个DataFrame,其列中包含许多缺失值,我希望将其分组:
import pandas as pd
import numpy as np
df = pd.DataFrame({'a': ['1', '2', '3'], 'b': ['4', np.NaN, '6']})
In [4]: df.groupby('b').groups
Out[4]: {'4': [0], '6': [2]}
Run Code Online (Sandbox Code Playgroud)
看到Pandas已经删除了具有NaN目标值的行.(我想要包含这些行!)
由于我需要很多这样的操作(许多cols都缺少值),并且使用比中位数(通常是随机森林)更复杂的函数,我想避免编写太复杂的代码片段.
有什么建议?我应该为此编写一个函数还是有一个简单的解决方案?