我想将我的数据集分成两个子集,其中一半包含低于中位数的所有值,另一半包含高于中位数的值。
问题:我的数据集有多个观测值与中位数相同。所以,
v <- c(1,2,3,3,3,3,3,4)
med <- median(v)
upper <- v[which(v >= med)]
lower <- v[which(v <= med)]
Run Code Online (Sandbox Code Playgroud)
不起作用,因为等于中位数的值将出现在两个集合中并且被过度代表。
我的预期输出是
lower: 1,2,3,3
upper: 3,3,3,4
Run Code Online (Sandbox Code Playgroud)
如何按 R 中的中位数分割我的数据框?
根据您的要求,我们只需要将已排序的向量分成两半。但是,我们需要考虑元素数为奇数的情况,因此我们使用round(length(v))
奇数长度向量获取最近的整数元素:
v <- sort(v)
lower <- v[1:round(length(v)/2)]
upper <- v[round((length(v)/2)+1):length(v)]
lower
[1] 1 2 3 3
upper
[1] 3 3 3 4
Run Code Online (Sandbox Code Playgroud)