填充 DataFrame MultiIndex 级别 1 中的空白，每个级别 0 的情况不同

Question

填充 DataFrame MultiIndex 级别 1 中的空白，每个级别 0 的情况不同

fee*_*wet 3 python multi-index dataframe pandas

我有一个 MultiIndex DataFrame，其级别 1 上有间隙日期值，如下所示：

np.random.seed(456)
j = [(a, b) for a in ['A','B','C'] for b in random.sample(pd.date_range('2018-01-01', periods=100, freq='D').tolist(), 5)]
j.sort()
i = pd.MultiIndex.from_tuples(j, names=['Name','Date'])
df = pd.DataFrame(np.random.random_integers(0,100,15), i, columns=['Vals'])
# print(df):
                 Vals
Name Date            
A    2018-01-01    27
     2018-01-08    43
     2018-03-26    89
     2018-03-29    42
     2018-04-01    28
B    2018-01-02    79
     2018-01-26    60
     2018-02-18    45
     2018-03-11    37
     2018-03-23    92
C    2018-03-17    39
     2018-03-20    81
     2018-03-21    11
     2018-03-27    77
     2018-04-08    69

Run Code Online (Sandbox Code Playgroud)

对于每个 0 级值，我想用该 0 级的最小日期值和最大日期值之间的每个日历日期填充索引级别 1 。（此问答解决了为所有级别 0 值设置相同值来填充级别 1 的情况。）

例如，subset = df.loc['A']我想插入行以便subset.index.values == pd.date_range(subset.index.values.min(), subset.index.values.max()).values. 即，生成的 DataFrame 将如下所示：

                 Vals
Name Date            
A    2018-01-01    27
     2018-01-02   NaN
     2018-01-03   NaN
     2018-01-04   NaN
     2018-01-05   NaN
     2018-01-06   NaN
     2018-01-07   NaN
     2018-01-08    43
     2018-01-09   NaN
...

Run Code Online (Sandbox Code Playgroud)

有没有一个 pandaic 方法来完成这个？

（我能想到的最好办法是低效地迭代地为每个 0 级值附加新的 DataFrame。或者类似地迭代构建索引值列表，然后将pandas.concat它们与原始 DataFrame 一起构建。）

Answer 1

WeN*_*Ben 5

您可以使用asfreq

df.groupby(level=0).apply(lambda x: x.reset_index(level=0, drop=True).asfreq("D"))

Run Code Online (Sandbox Code Playgroud)

归档时间：	7 年，7 月前
查看次数：	1023 次
最近记录：	7 年，7 月前