替换多索引数据框中的特定值

Sid*_*don 5 python multi-index dataframe pandas

我有一个带有 3 个索引级别和 2 个数字列的多索引数据框。

A   1   2017-04-01  14.0    87.346878
        2017-06-01  4.0     87.347504
    2   2014-08-01  1.0     123.110001
        2015-01-01  4.0     209.612503
B   3   2014-07-01  1.0     68.540001
        2014-12-01  1.0     64.370003
    4   2015-01-01  3.0     75.000000
Run Code Online (Sandbox Code Playgroud)

我想在新的第二级索引开始的任何地方替换第三级索引第一行中的值。例如:每一行

(A,1,2017-04-01)->0.0   0.0 
(A,2,2014-08-01)->0.0   0.0  
(B,3,2014-07-01)->0.0   0.0  
(B,4,2015-01-01)->0.0   0.0
Run Code Online (Sandbox Code Playgroud)

数据帧太大,按数据帧做数据帧df.xs('A,1')...df.xs(A,2)会很耗时。有什么方法可以让我得到一个掩码并用这些位置的新值替换吗?

Shu*_*rma 1

使用DataFrame.reset_indexon level=2,然后使用DataFrame.groupbyonlevel=[0, 1]并使用level_2using进行聚合first,然后使用 usingpd.MultiIndex.from_arrays创建多级索引,最后使用此多级索引来更改数据帧中的值:

idx = df.reset_index(level=2).groupby(level=[0, 1])['level_2'].first()
idx = pd.MultiIndex.from_arrays(idx.reset_index().to_numpy().T)
df.loc[idx, :] = 0
Run Code Online (Sandbox Code Playgroud)

结果:

# print(df)
               col1        col2
A 1 2017-04-01  0.0    0.000000
    2017-06-01  4.0   87.347504
  2 2014-08-01  0.0    0.000000
    2015-01-01  4.0  209.612503
B 3 2014-07-01  0.0    0.000000
    2014-12-01  1.0   64.370003
  4 2015-01-01  0.0    0.000000
Run Code Online (Sandbox Code Playgroud)