小编Don*_*eon的帖子

通过从熊猫数据框中的非缺失值中随机选择来填充缺失数据

我有一个熊猫数据框,其中有几个缺失值。我注意到非缺失值彼此接近。因此,我想通过随机选择非缺失值来估算缺失值。

例如:

import pandas as pd
import random
import numpy as np

foo = pd.DataFrame({'A': [2, 3, np.nan, 5, np.nan], 'B':[np.nan, 4, 2, np.nan, 5]})
foo
    A   B
0   2 NaN
1   3   4
2 NaN   2   
3   5 NaN
4 NaN   5
Run Code Online (Sandbox Code Playgroud)

我想比如foo['A'][2]=2foo['A'][5]=3 我的熊猫的形状数据框是(6940,154)。我尝试这个

foo['A'] = foo['A'].fillna(random.choice(foo['A'].values.tolist()))
Run Code Online (Sandbox Code Playgroud)

但它不起作用。你能帮我实现吗?最好的祝福。

python missing-data pandas

6
推荐指数
3
解决办法
5610
查看次数

标签 统计

missing-data ×1

pandas ×1

python ×1