目标
我有一个Pandas数据框,如下所示,有多列,想得到列的总数,MyColumn.
数据框 -df:
print df
X MyColumn Y Z
0 A 84 13.0 69.0
1 B 76 77.0 127.0
2 C 28 69.0 16.0
3 D 28 28.0 31.0
4 E 19 20.0 85.0
5 F 84 193.0 70.0
Run Code Online (Sandbox Code Playgroud)
我的尝试:
我试图使用groupby和得到列的总和.sum():
Total = df.groupby['MyColumn'].sum()
print Total
Run Code Online (Sandbox Code Playgroud)
这会导致以下错误:
TypeError: 'instancemethod' object has no attribute '__getitem__'
Run Code Online (Sandbox Code Playgroud)
预期产出
我原本预计输出如下:
319
Run Code Online (Sandbox Code Playgroud)
或者,我希望df使用包含总数的新row标题进行编辑TOTAL:
X MyColumn Y Z
0 A …Run Code Online (Sandbox Code Playgroud) 这是使用的数据示例:
SCENARIO DATE POD AREA IDOC STATUS TYPE
AAA 02.06.2015 JKJKJKJKJKK 4210 713375 51 1
AAA 02.06.2015 JWERWERE 4210 713375 51 1
AAA 02.06.2015 JAFDFDFDFD 4210 713375 51 9
BBB 02.06.2015 AAAAAAAA 5400 713504 51 43
CCC 05.06.2015 BBBBBBBBBB 4100 756443 51 187
AAA 05.06.2015 EEEEEEEE 4100 756457 53 228
Run Code Online (Sandbox Code Playgroud)
我已经在pandas中将以下代码编写为groupby:
import pandas as pd
import numpy as np
xl = pd.ExcelFile("MRD.xlsx")
df = xl.parse("Sheet3")
#print (df.column.values)
# The following gave ValueError: Cannot label index with a null key
# …Run Code Online (Sandbox Code Playgroud)