如果给出R中每个值的计数,我怎样才能轻松得到均值,中位数,四分位数等?

Rya*_*son 4 statistics r

假设我有一个数据框,其中包含值列和另一列,表示观察到该值的次数:

x <- data.frame(value=c(1,2,3), count=c(4,2,1))
x
#   value count
# 1     1     4
# 2     2     2
# 3     3     1
Run Code Online (Sandbox Code Playgroud)

我知道我可以weighted.mean使用weighted.median几个软件包提供的函数来获取数据的加权平均值和加权中值(例如limma),但是如何获得我的数据的其他加权统计数据,例如第一和第三四分位数,也许是标准的偏差?使用"扩展"数据rep不是一种选择,因为sum(x$count)大约30亿(人类基因组的大小).

Pra*_*ani 7

你试过这些包吗?

  1. Hmisc - 它有几个加权统计,包括加权分位数

  2. laeken - 它有加权分位数.