堆叠正方形DataFrame仅保留上/下三角形

mga*_*ini 2 python numpy pandas

我有一个对称方DataFramepandas:

a = np.random.rand(3, 3)
a = (a + a.T)/2
np.fill_diagonal(a, 1.)
a = pd.DataFrame(a)
Run Code Online (Sandbox Code Playgroud)

看起来像这样:

          0         1         2
0  1.000000  0.747064  0.357616
1  0.747064  1.000000  0.631622
2  0.357616  0.631622  1.000000
Run Code Online (Sandbox Code Playgroud)

如果我应用这个stack方法,我会得到很多冗余信息(包括我不感兴趣的对角线):

0  0    1.000000
   1    0.747064
   2    0.357616
1  0    0.747064
   1    1.000000
   2    0.631622
2  0    0.357616
   1    0.631622
   2    1.000000
Run Code Online (Sandbox Code Playgroud)

有没有办法只使用"纯"获得较低(或较高)的三角形pandas

1  0    0.747064
2  0    0.357616
   1    0.631622
Run Code Online (Sandbox Code Playgroud)

mga*_*ini 6

我能想到的最简单的方法是强制上(或下)三角形为 NaN,因为默认情况下该stack方法不会包含 NaN:

a.values[np.triu_indices_from(a, 0)] = np.nan
a.stack()
Run Code Online (Sandbox Code Playgroud)

这使:

1  0    0.747064
2  0    0.357616
   1    0.631622
Run Code Online (Sandbox Code Playgroud)


Zer*_*ero 6

你可以用 mask

In [278]: a.mask(np.triu(np.ones(a.shape)).astype(bool)).stack()
Out[278]:
1  0    0.747064
2  0    0.357616
   1    0.631622
dtype: float64
Run Code Online (Sandbox Code Playgroud)

或者使用 where

In [285]: a.where(np.tril(np.ones(a.shape), -1).astype(bool)).stack()
Out[285]:
1  0    0.747064
2  0    0.357616
   1    0.631622
dtype: float64
Run Code Online (Sandbox Code Playgroud)