(我正在使用R.)对于一个名为"goodwords.corpus"的单词列表,我循环遍历语料库中的文档,并将单词"goodwords.corpus"中的每个单词替换为单词+ a数.
因此,例如,如果列表中包含"good"一词,并且列表中没有"晚安",则此文档:
I am having a good time goodnight
Run Code Online (Sandbox Code Playgroud)
会变成:
I am having a good 1234 time goodnight
Run Code Online (Sandbox Code Playgroud)
**我正在使用此代码(EDIT-使此可重现):
goodwords.corpus <- c("good")
test <- "I am having a good time goodnight"
for (i in 1:length(goodwords.corpus)){
test <-gsub(goodwords.corpus[[i]], paste(goodwords.corpus[[i]], "1234"), test)
}
Run Code Online (Sandbox Code Playgroud)
但是,问题是我希望gsub只替换整个单词.出现的问题是:"goodwords"在"goodwords.corpus"列表中,但是"goodnight"(不在列表中)也会受到影响.所以我明白了:
I am having a good 1234 time good 1234night
Run Code Online (Sandbox Code Playgroud)
无论如何,我可以告诉gsub只能替换整个单词,而不是可能是其他单词的一部分的单词吗?
我想用这个:
test <-gsub("\\<goodwords.corpus[[i]]\\>", paste(goodwords.corpus[[i]], "1234"), test)
}
Run Code Online (Sandbox Code Playgroud)
我读过\ <和\>会告诉gsub只查找整个单词.但显然这不起作用,因为当引用时,goodwords.corpus [[i]]将不起作用.
有什么建议?
首先,我有一个令人尴尬的问题.R中的逗号代表什么?例如,每当有类似unique[x3,]或类似的代码时,括号前的逗号是什么?
第二,
mosaicplot(UCBAdmissions[,,i],)
Run Code Online (Sandbox Code Playgroud)
方括号内的两个逗号是什么意思?