我有一个包含许多列的数据集,我必须选择它们的一部分并重命名它们以便偶尔进行分析.我select从包中使用的那一刻dplyr.但是,每次为许多属性进行设置都很复杂.有更好的方法吗?
例如,我使用数据集 mtcars
> head(mtcars)
mpg cyl disp hp drat wt qsec vs am gear carb
Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4
Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4
Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1
Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1
Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2
Valiant 18.1 6 225 105 2.76 3.460 20.22 1 0 3 1
Run Code Online (Sandbox Code Playgroud)
我想选择列:mpg,cyl并将它们重命名为x,y
我用的时刻:
> df <- mtcars %>% select(x=mpg, y=cyl)
> head(df)
x y
Mazda RX4 21.0 6
Mazda RX4 Wag 21.0 6
Datsun 710 22.8 4
Hornet 4 Drive 21.4 6
Hornet Sportabout 18.7 8
Valiant 18.1 6
Run Code Online (Sandbox Code Playgroud)
它有效,但是当我经常更改括号中的参数时,这很麻烦.我希望使用列表来解决问题,但它不起作用.
例如,我希望创建一个属性列表,使其变得简单:
myselection <- c(
x = mpg,
y = cyl
)
df <- mtcars %>% select(myselection) # It is wrong!
Run Code Online (Sandbox Code Playgroud)
但这是错误的,我怎么能让它发挥作用?
您需要非标准的评估(从技术上讲,这是标准评估,正常的dplyr使用是NSE),请参阅vignette("nse"):
library(dplyr)
dots <- list(x="mpg", y="cyl")
select_(mtcars, .dots = dots)
Run Code Online (Sandbox Code Playgroud)
基础R可以替代
myselection <- c(x = "mpg", y = "cyl")
setNames(mtcars[myselection], names(myselection))
Run Code Online (Sandbox Code Playgroud)