使用以前的非缺失值填写缺失的pandas数据,按键分组

Question

使用以前的非缺失值填写缺失的pandas数据,按键分组

Chr*_*isB 16 python nan missing-data pandas data-cleaning

我正在处理像这样的pandas DataFrames:

Run Code Online (Sandbox Code Playgroud)

我想用一个具有相同'id'值的行替换每个NAN'x'和之前的非NAN'x':

Run Code Online (Sandbox Code Playgroud)

有没有一些光滑的方法来做到这一点,而无需手动循环行？

Answer 1

unu*_*tbu 21

您可以对每个组执行groupby/forward-fill操作:

import numpy as np
import pandas as pd

df = pd.DataFrame({'id': [1,1,2,2,1,2,1,1], 'x':[10,20,100,200,np.nan,np.nan,300,np.nan]})
df['x'] = df.groupby(['id'])['x'].ffill()
print(df)

Run Code Online (Sandbox Code Playgroud)

产量

   id      x
0   1   10.0
1   1   20.0
2   2  100.0
3   2  200.0
4   1   20.0
5   2  200.0
6   1  300.0
7   1  300.0

Run Code Online (Sandbox Code Playgroud)

您也可以执行 `df['x'] = df.groupby('id').fillna(method='ffill')` 来实现相同的语法，语法稍微简单一些。 (3认同)

归档时间：	12 年，8 月前
查看次数：	9396 次
最近记录：	7 年，8 月前