pandas groupby删除列

Question

pandas groupby删除列

use*_*415 12 python dataframe pandas pandas-groupby

我正在通过操作做一个简单的组,试图比较组的意思.如下所示,我从较大的数据框中选择了特定列,从中删除了所有缺失值.

选定的列和df头

但是当我分组时,我失去了几列:

分组逻辑和结果df

我从来没有遇到过大熊猫的问题,而且我在堆栈溢出上找不到任何类似的东西.有人有任何见解吗？

Answer 1

jez*_*ael 20

我想是这里Automatic exclusion of 'nuisance' columns所描述的.

样品:

df = pd.DataFrame({'C': {0: -0.91985400000000006, 1: -0.042379, 2: 1.2476419999999999, 3: -0.00992, 4: 0.290213, 5: 0.49576700000000001, 6: 0.36294899999999997, 7: 1.548106}, 'A': {0: 'foo', 1: 'bar', 2: 'foo', 3: 'bar', 4: 'foo', 5: 'bar', 6: 'foo', 7: 'foo'}, 'B': {0: 'one', 1: 'one', 2: 'two', 3: 'three', 4: 'two', 5: 'two', 6: 'one', 7: 'three'}, 'D': {0: -1.131345, 1: -0.089328999999999992, 2: 0.33786300000000002, 3: -0.94586700000000001, 4: -0.93213199999999996, 5: 1.9560299999999999, 6: 0.017587000000000002, 7: -0.016691999999999999}})

Run Code Online (Sandbox Code Playgroud)

print (df)
     A      B         C         D
0  foo    one -0.919854 -1.131345
1  bar    one -0.042379 -0.089329
2  foo    two  1.247642  0.337863
3  bar  three -0.009920 -0.945867
4  foo    two  0.290213 -0.932132
5  bar    two  0.495767  1.956030
6  foo    one  0.362949  0.017587
7  foo  three  1.548106 -0.016692

print( df.groupby('A').mean())
            C         D
A                      
bar  0.147823  0.306945
foo  0.505811 -0.344944

Run Code Online (Sandbox Code Playgroud)

我想你可以查一下DataFrame.dtypes.

@spacedustpi - 你认为 `df.groupby('A', as_index=False).mean()` 还是 `df.groupby('A').mean().reset_index()` ？ (3认同)
是的,所以`.reset_index()`不工作？ (2认同)

Answer 2

Dig*_*ant 13

尝试df.groupby(['col_1', 'col_2'], as_index=False).mean()。用于as_index=False保留列名称。默认为 True。上面的评论已经回答了这个问题，但将其发布为答案。

Answer 3

Sam*_*esi 5

确保您的列采用数字/整数格式，而不是“O”作为对象格式。这是它对我来说消失的原因之一。

您可以通过下面的代码检查该列的格式：

df.column.dtypes

Run Code Online (Sandbox Code Playgroud)

归档时间：	9 年，8 月前
查看次数：	13540 次
最近记录：	7 年，8 月前