相关疑难解决方法(0)

dplyr - mutate:使用动态变量名

我想使用dplyr dplyr::mutate()在数据框中创建多个新列.应动态生成列名称及其内容.

来自虹膜的示例数据:

library(dplyr)
iris <- tbl_df(iris)

Run Code Online (Sandbox Code Playgroud)

我已经创建了一个函数来改变Petal.Width变量中的新列:

multipetal <- function(df, n) {
    varname <- paste("petal", n , sep=".")
    df <- mutate(df, varname = Petal.Width * n)  ## problem arises here
    df
}

Run Code Online (Sandbox Code Playgroud)

现在我创建一个循环来构建我的列:

for(i in 2:5) {
    iris <- multipetal(df=iris, n=i)
}

Run Code Online (Sandbox Code Playgroud)

但是,由于mutate认为varname是一个文字变量名,因此循环只创建一个新变量(称为varname)而不是四个(称为petal.2 - petal.5).

如何将mutate()动态名称用作变量名？

r r-faq dplyr

Tim*_* S.

2019 08-05

131
推荐指数

6
解决办法

9万
查看次数

dplyr在遵守group_by的同时使用动态变量名称进行突变

我正在按照

使用变量列和 dplyr进行dplyr mutate-mutate：使用动态变量名

在mutate中使用动态名称。我要做的是按受最小标准偏差限制的组对列数据进行标准化。每列都有不同的最小标准偏差

例如（为方便起见，我省略了循环和映射语句）

require(dplyr)
require(magrittr)
data(iris)
iris <- tbl_df(iris)

minsd <- c('Sepal.Length' = 0.8)
varname <- 'Sepal.Length'

iris %>% group_by(Species) %>% mutate(!!varname := mean(pluck(iris,varname),na.rm=T)/max(sd(pluck(iris,varname)),minsd[varname]))

Run Code Online (Sandbox Code Playgroud)

我按照参考答案的建议进行了动态分配和变量选择。但是不尊重group_by（），至少对我来说，这是在此处使用dplyr的主要好处

所需的答案由

iris %>% group_by(Species) %>% mutate(!!varname := mean(Sepal.Length,na.rm=T)/max(sd(Sepal.Length),minsd[varname]))

Run Code Online (Sandbox Code Playgroud)

有没有解决的办法？

r dplyr

hjw*_*hjw

lucky-day

5
推荐指数

1
解决办法

1362
查看次数

标签统计

dplyr ×2

r ×2

r-faq ×1

dplyr - mutate:使用动态变量名

dplyr在遵守group_by的同时使用动态变量名称进行突变

标签 统计

标签统计