mik*_*ike 5 string r dataframe
我想选择数据框中我存储在字符串变量中的所有列.例如:
v1 <- rnorm(100)
v2 <- rnorm(100)
v3 <- rnorm(100)
df <- data.frame(v1,v2,v3)
Run Code Online (Sandbox Code Playgroud)
我想完成以下任务:
df[,c('v1','v2')]
Run Code Online (Sandbox Code Playgroud)
但我想使用变量而不是(c('v1','v2'))(这些都失败了):
select.me <- "'v1','v2'"
df[,select.me]
df[,c(select.me)]
df[,c(paste(select.me,sep=''))]
Run Code Online (Sandbox Code Playgroud)
感谢您帮助解决一个简单的问题,
42-*_*42- 17
这里的讽刺是,当你说"我想这样做"时,第一个表达应该成功,
df[,c('v1','v2')]
> str( df[,c('v1','v2')] )
'data.frame': 100 obs. of 2 variables:
$ v1: num -0.3347 0.2113 0.9775 -0.0151 -1.8544 ...
$ v2: num -1.396 -0.95 -1.254 0.822 0.141 ...
Run Code Online (Sandbox Code Playgroud)
而所有后来的尝试都会失败.我后来意识到你不知道你可以使用 select.me <- c('v1','v2') ; df[ , select.me]
.您也可以使用这些在某些情况下可能更安全的表单:
df[ , names(df) %in% select.me] # logical indexing
df[ , grep(select.me, names(df) ) ] # numeric indexing
df[ , grepl(select.me, names(df) ) ] # logical indexing
Run Code Online (Sandbox Code Playgroud)
其中任何一个都可以与negation(!logical
)或minus(-numeric
)一起使用来检索补码,而你不能使用带有否定的字符索引.如果您希望在可理解性方面达到一个级别,并且愿意将select.me
值更改为有效的R表达式,则可以执行以下操作:
select.me <- "c('v1','v2')"
df[ , eval(parse(text=select.me)) ]
Run Code Online (Sandbox Code Playgroud)
不是我推荐这个...只是为了让你知道在你"学会走路"之后这种可能性.也可能(虽然相当巴洛克式)使用您的原始引用字符串来提取信息(尽管我认为这只能说明为什么您的第一个版本更优秀):
select.me <- "'v1','v2'"
df [ , scan(textConnection(select.me), what="", sep=",") ]
> str( df [ , scan(textConnection(select.me), what="", sep=",") ] )
Read 2 items
'data.frame': 100 obs. of 2 variables:
$ v1: num -0.3347 0.2113 0.9775 -0.0151 -1.8544 ...
$ v2: num -1.396 -0.95 -1.254 0.822 0.141 ...
Run Code Online (Sandbox Code Playgroud)
这是基本的R
sytnax,也许你需要阅读介绍性手册
select.me <- c('v1','v2')
df[,select.me]
Run Code Online (Sandbox Code Playgroud)