获取分组描述的列

Agu*_*lar 4 python bigdata pandas

我感兴趣的是从 Pandas 数据集中获取数据描述。这些数据指的是不同人的假期。

此外,访问过的地点数量也存储在该城市中。

       City     Name   Places
0   Seattle    Alice   10
1   Seattle      Bob   11
2  Portland  Mallory   7
3   Seattle  Mallory   5
4   Memphis      Bob   6
5  Portland  Mallory   9
6   Memphis    Alice   1
7   Memphis    Alice   20
8   Seattle    Alice   14
9   Seattle      Bob   10
Run Code Online (Sandbox Code Playgroud)

我想从 DataFrame.describe() 获取数据

新的数据框应该如下所示。

Name    City   Count   Mean   Std   Min   25%   50%   75%   Max
Alice   Seattle    2   X      X     X     X     X     X     X
Alice   Memphis    2   X      X     X     X     X     X     X
Bob     Seattle    2   X      X     X     X     X     X     X
Bob     Memphis    1   X      X     X     X     X     X     X
Mallory Portland   2   X      X     X     X     X     X     X
Mallory Seattle    1   X      X     X     X     X     X     X
Run Code Online (Sandbox Code Playgroud)

谢谢!

jez*_*ael 8

我认为你需要groupby最后describe重塑unstack

df = df.groupby(['Name','City'])['Places'].describe().unstack().reset_index()
print (df)
      Name      City  count  mean        std   min    25%   50%    75%   max
0    Alice   Memphis    2.0  10.5  13.435029   1.0   5.75  10.5  15.25  20.0
1    Alice   Seattle    2.0  12.0   2.828427  10.0  11.00  12.0  13.00  14.0
2      Bob   Memphis    1.0   6.0        NaN   6.0   6.00   6.0   6.00   6.0
3      Bob   Seattle    2.0  10.5   0.707107  10.0  10.25  10.5  10.75  11.0
4  Mallory  Portland    2.0   8.0   1.414214   7.0   7.50   8.0   8.50   9.0
5  Mallory   Seattle    1.0   5.0        NaN   5.0   5.00   5.0   5.00   5.0
Run Code Online (Sandbox Code Playgroud)