按中位数拆分数据框

Question

我想将我的数据集分成两个子集，其中一半包含低于中位数的所有值，另一半包含高于中位数的值。

问题：我的数据集有多个观测值与中位数相同。所以，

v <- c(1,2,3,3,3,3,3,4)
med <- median(v)
upper <- v[which(v >= med)]
lower <- v[which(v <= med)]

不起作用，因为等于中位数的值将出现在两个集合中并且被过度代表。

我的预期输出是

lower: 1,2,3,3
upper: 3,3,3,4

如何按 R 中的中位数分割我的数据框？

Answer 1

根据您的要求，我们只需要将已排序的向量分成两半。但是，我们需要考虑元素数为奇数的情况，因此我们使用round(length(v))奇数长度向量获取最近的整数元素：

v <- sort(v)
lower <- v[1:round(length(v)/2)] 
upper <- v[round((length(v)/2)+1):length(v)] 

lower
[1] 1 2 3 3
upper
[1] 3 3 3 4