mga*_*ini 2 python numpy pandas
我有一个对称方DataFrame在pandas:
a = np.random.rand(3, 3)
a = (a + a.T)/2
np.fill_diagonal(a, 1.)
a = pd.DataFrame(a)
Run Code Online (Sandbox Code Playgroud)
看起来像这样:
0 1 2
0 1.000000 0.747064 0.357616
1 0.747064 1.000000 0.631622
2 0.357616 0.631622 1.000000
Run Code Online (Sandbox Code Playgroud)
如果我应用这个stack方法,我会得到很多冗余信息(包括我不感兴趣的对角线):
0 0 1.000000
1 0.747064
2 0.357616
1 0 0.747064
1 1.000000
2 0.631622
2 0 0.357616
1 0.631622
2 1.000000
Run Code Online (Sandbox Code Playgroud)
有没有办法只使用"纯"获得较低(或较高)的三角形pandas?
1 0 0.747064
2 0 0.357616
1 0.631622
Run Code Online (Sandbox Code Playgroud)
我能想到的最简单的方法是强制上(或下)三角形为 NaN,因为默认情况下该stack方法不会包含 NaN:
a.values[np.triu_indices_from(a, 0)] = np.nan
a.stack()
Run Code Online (Sandbox Code Playgroud)
这使:
1 0 0.747064
2 0 0.357616
1 0.631622
Run Code Online (Sandbox Code Playgroud)
你可以用 mask
In [278]: a.mask(np.triu(np.ones(a.shape)).astype(bool)).stack()
Out[278]:
1 0 0.747064
2 0 0.357616
1 0.631622
dtype: float64
Run Code Online (Sandbox Code Playgroud)
或者使用 where
In [285]: a.where(np.tril(np.ones(a.shape), -1).astype(bool)).stack()
Out[285]:
1 0 0.747064
2 0 0.357616
1 0.631622
dtype: float64
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
1455 次 |
| 最近记录: |