使用gsub替换字符,如何创建函数?

jra*_*ara 17 regex r gsub

我正在尝试替换data.frame中的字符.我有一个解决方案

> df <- data.frame(var1 = c("aabbcdefg", "aabbcdefg"))
> df
       var1
1 aabbcdefg
2 aabbcdefg
> df$var1 <- gsub("a", "h", df$var1)
> df$var1 <- gsub("b", "i", df$var1)
> df$var1 <- gsub("c", "j", df$var1)
> df$var1 <- gsub("d", "k", df$var1)
> df$var1 <- gsub("e", "l", df$var1)
> df$var1 <- gsub("f", "m", df$var1)
> df
       var1
1 hhiijklmg
2 hhiijklmg
> 
Run Code Online (Sandbox Code Playgroud)

但我想避免使用几个gsub调用,生成一个函数立即执行此操作会更好吗?

有什么想法要继续吗?

Mar*_*rek 35

你想要chartr:

df$var1 <- chartr("abcdef", "hijklm", df$var1)
df
#        var1
# 1 hhiijklmg
# 2 hhiijklmg
Run Code Online (Sandbox Code Playgroud)


Jea*_*ert 21

你可以创建fromto矢量:

from <- c('a','b','c','d','e','f')
to <- c('h','i','j','k','l','m')
Run Code Online (Sandbox Code Playgroud)

然后矢量化gsub函数:

gsub2 <- function(pattern, replacement, x, ...) {
for(i in 1:length(pattern))
x <- gsub(pattern[i], replacement[i], x, ...)
x
}
Run Code Online (Sandbox Code Playgroud)

这使:

> df <- data.frame(var1 = c("aabbcdefg", "aabbcdefg"))
> df$var1 <- gsub2(from, to, df$var1)
> df
       var1
1 hhiijklmg
2 hhiijklmg
Run Code Online (Sandbox Code Playgroud)


Gre*_*now 11

如果您不想使用chartr,因为替换可能是多个字符,那么另一个选项是使用gsubfn包中的gsubfn(我知道这不是gsub,而是gsub上的扩展).这是一个例子:

> library(gsubfn)
> tmp <- list(a='apple',b='banana',c='cherry')
> gsubfn('.', tmp, 'a.b.c.d')
[1] "apple.banana.cherry.d"
Run Code Online (Sandbox Code Playgroud)

替换也可以是一个将匹配并返回该匹配的替换值的函数.