我有一个带有客户退款原因的 Pandas DataFrame。它包含以下示例数据行:
**case_type** **claim_type**
1 service service
2 service service
3 chargeback service
4 chargeback local_charges
5 service supplier_service
6 chargeback service
7 chargeback service
8 chargeback service
9 chargeback service
10 chargeback service
11 service service_not_used
12 service service_not_used
Run Code Online (Sandbox Code Playgroud)
我想将客户的原因与某种标记的原因进行比较。这没问题,但我还想查看特定组中的记录总数(客户原因)。
case_claim_type = df[["case_type", "claim_type"]]
case_claim_type.groupby(by=("case_type", "claim_type"))["case_type"].count()
Run Code Online (Sandbox Code Playgroud)
这给了我这个输出,例如:
**case_type** **claim_type**
service service 2
supplier_service 1
service_not_used 2
chargeback service 6
local_charges 1
Run Code Online (Sandbox Code Playgroud)
我还希望获得每个 case_type 的输出总和。就像是:
**case_type** **claim_type**
service service 2
supplier_service 1
service_not_used 2
total: 5
chargeback service 6 …Run Code Online (Sandbox Code Playgroud)