mee*_*ram 2 r lapply dataframe
我在数据框中有一些数字变量。我想创建以原始变量为中心的新变量,将新变量添加到我的数据框中,并重命名新变量,使其与原始变量具有相同的名称,但后缀为“_m”。
目前,我只能分两步执行此操作,并且我正在使用列索引进行子集化,这不是很灵活。
有没有办法将我的两阶段方法合二为一,并且还避免使用列索引,以便该过程可以正常工作,而无需计算我想要平均的列数,然后计算出这意味着添加多少新列到我的数据框?lapply如果有更好的方法,我不必使用。
这是我当前方法的简化版本:
df <- data.frame(a = letters[1:10], b = 1:10, c = 11:20)
df[4:5] <- lapply(df[2:3], function(x) {
y <- scale(x, center = T, scale = F)
}
)
names(df)[4:5] <- lapply(names(df)[2:3], function(x) {
y <- paste0(x, "_m")
}
)
Run Code Online (Sandbox Code Playgroud)
在基础 R 中,你可以做
cbind(df, setNames(lapply(df[2:3], scale, scale=F),
paste0(names(df)[2:3], "_m")))
Run Code Online (Sandbox Code Playgroud)
返回
a b c b_m c_m
1 a 1 11 -4.5 -4.5
2 b 2 12 -3.5 -3.5
3 c 3 13 -2.5 -2.5
4 d 4 14 -1.5 -1.5
5 e 5 15 -0.5 -0.5
6 f 6 16 0.5 0.5
7 g 7 17 1.5 1.5
8 h 8 18 2.5 2.5
9 i 9 19 3.5 3.5
10 j 10 20 4.5 4.5
Run Code Online (Sandbox Code Playgroud)
新列的名称使用setNames.
| 归档时间: |
|
| 查看次数: |
2533 次 |
| 最近记录: |