use*_*477 5 split r conditional-statements dataframe
我有看起来像这样的数据:
time <- c(1:20)
temp <- c(2,3,4,5,6,2,3,4,5,6,2,3,4,5,6,2,3,4,5,6)
data <- data.frame(time,temp)
Run Code Online (Sandbox Code Playgroud)
这是我数据的非常基本的表示。如果对此进行绘制,则可以很容易地看到有4组向上倾斜的数据。我想将原始数据帧分为这4个“子集”,以便可以对它们进行计算,例如“均值”,“最大”,“最小”和“标准”。我想使用split(),但它只会基于因子级别进行拆分。我希望能够提供split条件语句,例如split if :diff(data$temp) > -2。
我的问题实际上比这复杂得多,但是是否有类似的功能split可以让我根据条件语句创建新的数据框?根据因子水平进行拆分。
谢谢大家!
诀窍是将条件语句转换为可以解释为因子的内容。在这个特定的例子中:
tmp <- c(1,diff(data[[2]]))
# [1] 1 1 1 1 1 -4 1 1 1 1 -4 1 1 1 1 -4 1 1 1 1
tmp2 <- tmp < 0
# [1] FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE FALSE FALSE TRUE FALSE
# [13] FALSE FALSE FALSE TRUE FALSE FALSE FALSE FALSE
tmp3 <- cumsum(tmp2)
# [1] 0 0 0 0 0 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3
split(data, tmp3)
# $`0`
# time temp
# 1 1 2
# 2 2 3
# 3 3 4
# 4 4 5
# 5 5 6
#
# $`1`
# time temp
# 6 6 2
# 7 7 3
# 8 8 4
# 9 9 5
# 10 10 6
#
# $`2`
# time temp
# 11 11 2
# 12 12 3
# 13 13 4
# 14 14 5
# 15 15 6
#
# $`3`
# time temp
# 16 16 2
# 17 17 3
# 18 18 4
# 19 19 5
# 20 20 6
Run Code Online (Sandbox Code Playgroud)