Ssa*_*ank 7 python numpy r pandas
我有一个DataFrame df:
name count
aaaa 2000
bbbb 1900
cccc 900
dddd 500
eeee 100
Run Code Online (Sandbox Code Playgroud)
我想查看与计数列的中位数相差10倍的行.
我试过df['count'].median()并得到了中位数.但不知道如何进一步.你能建议我如何使用pandas/numpy吗?
预期产出:
name count distance from median
aaaa 2000 *****
Run Code Online (Sandbox Code Playgroud)
我可以使用任何度量作为距中位数的距离(绝对偏离中位数,分位数等).
Com*_*low 17
如果您正在寻找如何计算中位数绝对偏差 -
In [1]: df['dist'] = abs(df['count'] - df['count'].median())
In [2]: df
Out[2]:
name count dist
0 aaaa 2000 1100
1 bbbb 1900 1000
2 cccc 900 0
3 dddd 500 400
4 eeee 100 800
In [3]: df['dist'].median()
Out[3]: 800.0
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
32079 次 |
| 最近记录: |