我有一个包含 499 条记录的埃博拉数据集。我试图根据概率(概率变量)找到每个五分位数中的观察次数。观察的数量应该属于 0-20%、20-40% 等类别。我认为这样做的代码是,
test = pd.qcut(ebola.prob,5).value_counts()
Run Code Online (Sandbox Code Playgroud)
这返回
[0.044, 0.094] 111
(0.122, 0.146] 104
(0.106, 0.122] 103
(0.146, 0.212] 92
(0.094, 0.106] 89
Run Code Online (Sandbox Code Playgroud)
我的问题是如何排序以返回 0-20%、20-40% 40-60% 60-80% 80-100% 的正确观察数?
我试过了
test.value_counts(sort=False)
Run Code Online (Sandbox Code Playgroud)
这返回
104 1
89 1
92 1
103 1
111 1
Run Code Online (Sandbox Code Playgroud)
这是订单 104,89,92,103,111 吗?每五分之一?
我很困惑,因为如果我查看第一段代码的概率输出,它看起来应该是 111,89,103,104,92?