相关疑难解决方法(0)

熊猫MultiIndex DataFrame.rolling偏移量

为什么在rolling多索引DataFrame 时不能使用偏移量? 例如,使用:

rng = pd.date_range('2017-01-03', periods=20, freq='8D')
i = pd.MultiIndex.from_product([['A','B','C'], rng], names=['Name','Date'])
df = pd.DataFrame(np.random.randn(60), i, columns=['Vals'])
Run Code Online (Sandbox Code Playgroud)

如果我尝试使用偏移量进行分组和滚动,则会出现“ ValueError:窗口必须为整数 ”:

df['Avg'] = df.groupby(['Name'])['Vals'].rolling('30D').mean() # << Why doesn't this work?
Run Code Online (Sandbox Code Playgroud)

并不是以下这些变体可以满足我的需求,但请注意对int作品进行分组和滚动:

df['Avg'] = df.groupby(['Name'])['Vals'].rolling(4).mean()
Run Code Online (Sandbox Code Playgroud)

而且我可以在DataFrame的单索引子集上使用偏移量滚动:

d = df.loc['A']
d['Avg'] = d['Vals'].rolling('30D').mean()
Run Code Online (Sandbox Code Playgroud)

如果确实不可能在多索引DataFrame上进行偏移滚动,那么将零应用于每个级别0索引项的最有效的解决方法是什么?

python aggregate multi-index dataframe pandas

5
推荐指数
1
解决办法
665
查看次数

标签 统计

aggregate ×1

dataframe ×1

multi-index ×1

pandas ×1

python ×1