假设我有一个数据框,其中包含值列和另一列,表示观察到该值的次数:
x <- data.frame(value=c(1,2,3), count=c(4,2,1))
x
# value count
# 1 1 4
# 2 2 2
# 3 3 1
Run Code Online (Sandbox Code Playgroud)
我知道我可以weighted.mean使用weighted.median几个软件包提供的函数来获取数据的加权平均值和加权中值(例如limma),但是如何获得我的数据的其他加权统计数据,例如第一和第三四分位数,也许是标准的偏差?使用"扩展"数据rep不是一种选择,因为sum(x$count)大约30亿(人类基因组的大小).