连接字符串/字符的向量

Nic*_*ick 241 string r r-faq

如果我有一个字符类型的向量,我如何将值连接成字符串?这是我用paste()做的方法:

sdata = c('a', 'b', 'c')
paste(sdata[1], sdata[2], sdata[3], sep ='')
Run Code Online (Sandbox Code Playgroud)

屈服"abc".

但是,当然,这只有在我提前了解sdata的长度时才有效.

小智 435

尝试在粘贴函数中使用空的折叠参数:

paste(sdata, collapse = '')

感谢http://twitter.com/onelinetips/status/7491806343

  • 请注意,如果`sdata`可以包含长度相同或长度可变的字符串,那么应该使用`paste(sdata,sep ='',collapse ='')来避免意外结果. (7认同)

Ken*_*ams 39

马特的答案绝对是正确的答案.然而,这里是一个替代解决方案的漫画救济目的:

do.call(paste, c(as.list(sdata), sep = ""))
Run Code Online (Sandbox Code Playgroud)

  • 你真的可以在那里工作一个apply()语句.如果你这样做,我会投票给你;) (6认同)

LMc*_*LMc 8

图书馆stringr有一些快速的方法可以帮助您实现这一目标。

字符串展平

默认情况下,将折叠您的字符向量,不带空格,但也有 collapse参数:

str_flatten(sdata)
[1] "abc"
Run Code Online (Sandbox Code Playgroud)

还有一个可选last参数可以用来代替最后的分隔符。

字符串

pastecollapse需要指定参数来完成此操作类似:

str_c(sdata, collapse = "")
[1] "abc"
Run Code Online (Sandbox Code Playgroud)

str_flatten_comma

stringr如果您想要逗号分隔折叠,则从 1.5.0开始新增。这里的last参数识别牛津逗号:

str_flatten_comma(sdata)
[1] "a, b, c"

str_flatten_comma(sdata[1:2], last = " and ")
[1] "a and b"
Run Code Online (Sandbox Code Playgroud)

基础::粘贴0

虽然与 相比没有明显的优势paste,但您可以paste0(sdata, collapse = "")从基础 R开始使用。


更新更长的字符串向量的基准在我的机器上给出了以下结果:

set.seed(4)
x <- sample(letters, 1E6, replace = T)
microbenchmark(stri_paste(x, collapse=''), 
               paste(x,collapse=''), 
               do.call(paste, c(as.list(x), sep="")),
               stringr::str_flatten(x),
               stringr::str_c(x, collapse = ""),
               paste0(x, collapse = ""))

Unit: milliseconds
                                    expr      min        lq       mean     median        uq       max neval cld
            stri_paste(x, collapse = "")  21.1788  21.80040   23.45225   22.78430   24.4271   39.1305   100 a  
                 paste(x, collapse = "") 110.7734 114.36595  126.43277  119.02755  136.5902  187.4112   100  b 
 do.call(paste, c(as.list(x), sep = "")) 538.8329 981.80345 1090.51738 1096.33470 1213.8848 1457.5622   100   c
                 stringr::str_flatten(x)  20.6276  21.60610   23.36241   22.73915   24.2210   42.3481   100 a  
        stringr::str_c(x, collapse = "")  20.9274  21.74285   23.75466   22.73950   24.3254   36.6114   100 a  
                paste0(x, collapse = "") 110.0614 112.81175  124.15555  116.96610  130.6330  168.7199   100  b 
Run Code Online (Sandbox Code Playgroud)

同样本着肯·威廉姆斯回答的精神:

Reduce(paste0, sdata)
[1] "abc"
Run Code Online (Sandbox Code Playgroud)


Pat*_*ick 7

对于sdata

gsub(", ","",toString(sdata))
Run Code Online (Sandbox Code Playgroud)

对于整数向量:

gsub(", ","",toString(c(1:10)))
Run Code Online (Sandbox Code Playgroud)

  • 这是一个危险的答案——如果向量的元素中有逗号空格序列,这个答案将删除它们。 (6认同)

bar*_*nus 6

您可以像这样从包中使用stri_paste带有collapse参数的函数stringi

stri_paste(letters, collapse='')
## [1] "abcdefghijklmnopqrstuvwxyz" 
Run Code Online (Sandbox Code Playgroud)

还有一些基准:

require(microbenchmark)
test <- stri_rand_lipsum(100)
microbenchmark(stri_paste(test, collapse=''), paste(test,collapse=''), do.call(paste, c(as.list(test), sep="")))
Unit: microseconds
                                      expr     min       lq     mean   median       uq     max neval
           stri_paste(test, collapse = "") 137.477 139.6040 155.8157 148.5810 163.5375 226.171   100
                paste(test, collapse = "") 404.139 406.4100 446.0270 432.3250 442.9825 723.793   100
do.call(paste, c(as.list(test), sep = "")) 216.937 226.0265 251.6779 237.3945 264.8935 405.989   100
Run Code Online (Sandbox Code Playgroud)

  • 我从未在R.上执行过基准测试。 (2认同)

C8H*_*4O2 5

马特特纳的答案绝对是正确的答案。但是,本着 Ken Williams 回答的精神,您也可以这样做:

capture.output(cat(sdata, sep="")) 
Run Code Online (Sandbox Code Playgroud)