我有一个包含以下信息的数据框:
filename val1 val2
t
1 file1.csv 5 10
2 file1.csv NaN NaN
3 file1.csv 15 20
6 file2.csv NaN NaN
7 file2.csv 10 20
8 file2.csv 12 15
Run Code Online (Sandbox Code Playgroud)
我想基于索引在数据帧中插入值,但仅在每个文件组中.
为了插值,我通常会这样做
df = df.interpolate(method="index")
Run Code Online (Sandbox Code Playgroud)
我去做分组
grouped = df.groupby("filename")
Run Code Online (Sandbox Code Playgroud)
我希望插值数据框看起来像这样:
filename val1 val2
t
1 file1.csv 5 10
2 file1.csv 10 15
3 file1.csv 15 20
6 file2.csv NaN NaN
7 file2.csv 10 20
8 file2.csv 12 15
Run Code Online (Sandbox Code Playgroud)
NaN仍然存在于t = 6,因为它们是file2组中的第一项.
我怀疑我需要使用"申请",但未能确切地知道如何......
grouped.apply(interp1d)
...
TypeError: __init__() takes at least …Run Code Online (Sandbox Code Playgroud)