使用r中的if语句填充列

KT_*_*T_1 4 r

我有一个很简单的问题,我目前正在努力解决这个问题.如果我有一个示例数据帧:

a <- c(1:5)  
b <- c(1,3,5,9,11)
df1 <- data.frame(a,b)
Run Code Online (Sandbox Code Playgroud)

如何创建新列('c'),然后使用列b上的if语句填充该列.例如:对于b中的那些值为'cat',对于b中的那些值为1或2'dog',对于b中大于6的那些值,在3和5'兔子'之间为'

所以使用数据帧df1的列'c'将为:cat,dog,dog,rabbit,rabbit.

提前谢谢了.

42-*_*42- 6

dfrm$dc <- c("dog", "cat", "rabbit")[ findInterval(dfrm$b, c(1, 2.5, 5.5, Inf)) ]
Run Code Online (Sandbox Code Playgroud)

findInterval方法比嵌套ifelse策略快得多,而且我猜测要比循环unnested if语句的函数快得多.当我们选择效率低下的算法时,我们这些使用更大数据的人会注意到差异.

这实际上并没有解决这个问题,但我并不总是认为R的新用户会知道最有表现力或最有效的问题解决方法."使用IF"的请求听起来像是翻译两个主要宏统计处理器SPSS和SAS的典型编码方法.R if控制结构通常不是重新编码列的有效方法,因为其第一个位置的参数将仅针对第一个元素进行求值.它本身不处理列,而ifelse函数会这样做.该cut功能可能已被使用在这里(在适当breakslabels参数),但它会提供一个factor-值而不是字符值.findInterval选择该方法是因为它能够返回多个级别(单个ifelse不能).我认为ifelse在大约2或3级嵌套之后,链接或嵌套变得很快变得丑陋和混乱.

  • 未来的任何人都会在这个答案中遇到磕磕绊绊,在关闭方括号之前有一个缺失的亲密父母. (3认同)

Ant*_*ico 2

df1 <- 
    transform(
        df1 ,
        c =
            ifelse( b %in% 1:2 , 'cat' ,
            ifelse( b %in% 3:5 , 'dog' , 'rabbit' ) ) )
Run Code Online (Sandbox Code Playgroud)