fee*_*wet 3 python multi-index dataframe pandas
我有一个 MultiIndex DataFrame,其级别 1 上有间隙日期值,如下所示:
np.random.seed(456)
j = [(a, b) for a in ['A','B','C'] for b in random.sample(pd.date_range('2018-01-01', periods=100, freq='D').tolist(), 5)]
j.sort()
i = pd.MultiIndex.from_tuples(j, names=['Name','Date'])
df = pd.DataFrame(np.random.random_integers(0,100,15), i, columns=['Vals'])
# print(df):
Vals
Name Date
A 2018-01-01 27
2018-01-08 43
2018-03-26 89
2018-03-29 42
2018-04-01 28
B 2018-01-02 79
2018-01-26 60
2018-02-18 45
2018-03-11 37
2018-03-23 92
C 2018-03-17 39
2018-03-20 81
2018-03-21 11
2018-03-27 77
2018-04-08 69
Run Code Online (Sandbox Code Playgroud)
对于每个 0 级值,我想用该 0 级的最小日期值和最大日期值之间的每个日历日期填充索引级别 1 。(此问答解决了为所有级别 0 值设置相同值来填充级别 1 的情况。)
例如,subset = df.loc['A']我想插入行以便subset.index.values == pd.date_range(subset.index.values.min(), subset.index.values.max()).values. 即,生成的 DataFrame 将如下所示:
Vals
Name Date
A 2018-01-01 27
2018-01-02 NaN
2018-01-03 NaN
2018-01-04 NaN
2018-01-05 NaN
2018-01-06 NaN
2018-01-07 NaN
2018-01-08 43
2018-01-09 NaN
...
Run Code Online (Sandbox Code Playgroud)
有没有一个 pandaic 方法来完成这个?
(我能想到的最好办法是低效地迭代地为每个 0 级值附加新的 DataFrame。或者类似地迭代构建索引值列表,然后将pandas.concat它们与原始 DataFrame 一起构建。)
您可以使用asfreq
df.groupby(level=0).apply(lambda x: x.reset_index(level=0, drop=True).asfreq("D"))
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
1023 次 |
| 最近记录: |