相关疑难解决方法(0)

dplyr - mutate:使用动态变量名

我想使用dplyr dplyr::mutate()在数据框中创建多个新列.应动态生成列名称及其内容.

来自虹膜的示例数据:

library(dplyr)
iris <- tbl_df(iris)
Run Code Online (Sandbox Code Playgroud)

我已经创建了一个函数来改变Petal.Width变量中的新列:

multipetal <- function(df, n) {
    varname <- paste("petal", n , sep=".")
    df <- mutate(df, varname = Petal.Width * n)  ## problem arises here
    df
}
Run Code Online (Sandbox Code Playgroud)

现在我创建一个循环来构建我的列:

for(i in 2:5) {
    iris <- multipetal(df=iris, n=i)
}
Run Code Online (Sandbox Code Playgroud)

但是,由于mutate认为varname是一个文字变量名,因此循环只创建一个新变量(称为varname)而不是四个(称为petal.2 - petal.5).

如何将mutate()动态名称用作变量名?

r r-faq dplyr

131
推荐指数
6
解决办法
9万
查看次数

dplyr在遵守group_by的同时使用动态变量名称进行突变

我正在按照

使用变量列dplyr进行dplyr mutate-mutate:使用动态变量名

在mutate中使用动态名称。我要做的是按受最小标准偏差限制的组对列数据进行标准化。每列都有不同的最小标准偏差

例如(为方便起见,我省略了循环和映射语句)

require(dplyr)
require(magrittr)
data(iris)
iris <- tbl_df(iris)

minsd <- c('Sepal.Length' = 0.8)
varname <- 'Sepal.Length'

iris %>% group_by(Species) %>% mutate(!!varname := mean(pluck(iris,varname),na.rm=T)/max(sd(pluck(iris,varname)),minsd[varname]))
Run Code Online (Sandbox Code Playgroud)

我按照参考答案的建议进行了动态分配和变量选择。但是不尊重group_by(),至少对我来说,这是在此处使用dplyr的主要好处

所需的答案由

iris %>% group_by(Species) %>% mutate(!!varname := mean(Sepal.Length,na.rm=T)/max(sd(Sepal.Length),minsd[varname]))
Run Code Online (Sandbox Code Playgroud)

有没有解决的办法?

r dplyr

5
推荐指数
1
解决办法
1362
查看次数

标签 统计

dplyr ×2

r ×2

r-faq ×1