一次操作多列(或行)的编程方式是什么?考虑这个例子:
df2 <- data.frame(a = 1:10, b = 5:14, c = 10:1, d = 14:5)
Run Code Online (Sandbox Code Playgroud)
我想创建两个包含a/b和c/d比率的新列.为简单起见,我们假设所有列之间的空间关系是一致的.只需要制作两列,就可以这样做:
df2$ab <- with(df2, a/b)
df2$cd <- with(df2, c/d)
Run Code Online (Sandbox Code Playgroud)
要么
df2 <- transform(df2, ab = a/b, cd = c/d)
Run Code Online (Sandbox Code Playgroud)
要创建最终产品,例如:
a b c d ab cd
1 1 5 10 14 0.2000000 0.7142857
2 2 6 9 13 0.3333333 0.6923077
3 3 7 8 12 0.4285714 0.6666667
4 4 8 7 11 0.5000000 0.6363636
5 5 9 6 10 0.5555556 0.6000000
6 6 10 5 9 0.6000000 0.5555556
7 7 11 4 8 0.6363636 0.5000000
8 8 12 3 7 0.6666667 0.4285714
9 9 13 2 6 0.6923077 0.3333333
10 10 14 1 5 0.7142857 0.2000000
Run Code Online (Sandbox Code Playgroud)
但是如果有100个列需要迭代怎么办呢?我通常使用Excel或SQL来连接代码并将其放在我的.R脚本中,但似乎必须有一种方法来解决这个问题.
完全披露:这个问题与交叉验证的问题有关,我将一个无法解决的解决方案整合在一起.
尝试这个解决方案:
df2 <- data.frame(a = 1:10, b = 5:14, c = 10:1, d = 14:5, e = 34:43, f = 56:65)
n <- ncol(df2)
s1 <- seq(1, n, 2)
s2 <- seq(2, n, 2)
df2[paste(names(df2)[s1], names(df2)[s2], sep="")] <- df2[, s1] / df2[, s2]
Run Code Online (Sandbox Code Playgroud)