循环 R 中的因子级别 - 如何操作两个连续级别

Ant*_*tti 5 loops r dataframe dplyr

我需要在 R data.frame 中循环因子级别。在循环内部,我需要对包含由这些级别对定义的子集的 data.frames 进行操作。这些对是该因素的两个连续的唯一级别。

这是我尝试过的示例:

require(dplyr)

df <- data.frame(fac = rep(c("A", "B", "C"), 3))

for(i in levels(fac)){

   if(i != levels(fac)[length(levels(fac))]){
      df %>% filter(fac %in% c(i, i + 1))
   }
}
Run Code Online (Sandbox Code Playgroud)

我尝试包含级别i及其后续级别,但显然表达i + 1不会起作用。如何解决这个问题?我是否必须使可变fac数值或有更简洁的解决方案可用?

编辑:输出(对于这个例子)应该是这两个 data.frames:

dfAB <- df %>% filter(fac %in% c("A", "B"))
dfBC <- df %>% filter(fac %in% c("B", "C"))
Run Code Online (Sandbox Code Playgroud)

kat*_*ath 6

问题是,您遍历所有级别的 fac,这是一个字符向量,因此R不能将 1 添加到i.

以下工作:

library(dplyr)

df <- data.frame(fac = rep(c("A", "B", "C"), 3))

df <- df %>% 
  mutate(fac = factor(fac, levels = c("A", "B", "C")))

for(i in seq_along(levels(df$fac))){
  if(i != length(levels(df$fac))){
    df %>% filter(fac %in% c(levels(fac)[i], levels(fac)[i+1])) %>% print()
  }
}

#   fac
# 1   A
# 2   B
# 3   A
# 4   B
# 5   A
# 6   B
#   fac
# 1   B
# 2   C
# 3   B
# 4   C
# 5   B
# 6   C
Run Code Online (Sandbox Code Playgroud)

fac列必须是一个factor(否则过滤不起作用)。我print()在循环内部添加了打印结果,但您可能希望将其存储在某处(例如在列表中)。