小编old*_*rad的帖子

在pandas python中对qcut的五分位数输出进行排序

我有一个包含 499 条记录的埃博拉数据集。我试图根据概率(概率变量)找到每个五分位数中的观察次数。观察的数量应该属于 0-20%、20-40% 等类别。我认为这样做的代码是,

test = pd.qcut(ebola.prob,5).value_counts()
Run Code Online (Sandbox Code Playgroud)

这返回

[0.044, 0.094]    111
(0.122, 0.146]    104
(0.106, 0.122]    103
(0.146, 0.212]     92
(0.094, 0.106]     89
Run Code Online (Sandbox Code Playgroud)

我的问题是如何排序以返回 0-20%、20-40% 40-60% 60-80% 80-100% 的正确观察数?

我试过了

test.value_counts(sort=False)
Run Code Online (Sandbox Code Playgroud)

这返回

104    1
89     1
92     1
103    1
111    1
Run Code Online (Sandbox Code Playgroud)

这是订单 104,89,92,103,111 吗?每五分之一?

我很困惑,因为如果我查看第一段代码的概率输出,它看起来应该是 111,89,103,104,92?

python sorting

4
推荐指数
1
解决办法
1846
查看次数

标签 统计

python ×1

sorting ×1