x < - c('a','v','c','a','d','e','g','f','h','y','u',' R", 'S', 'W', 'S', 'd', 'G', 'J', 'U', 'R', 'S', 'S', 'S', 'v' , 'b', 'G', 'E', 'W', 'S', 'd', 'G', 'H', 'J', 'I', 'T', 'E'," W", 'W', 'q', 'q', 'd', 'v', 'b', 'M', 'M', 'K', 'L', 'U', 'p' , 'O', 'R', 'T', 'N', 'E', 'W', 'W', 'J', 'F', 'C', 'G', 'H'," T", 'R', 'd', 'E', 'W', 'W', 'W', 'Z', 'F', 'G', 'F', 'H', 'H' , 'Y', 'R', 'F', 'F', 'L')
y < - 样本(1:40,79,替换= T) …
dd$country
[1] US US US US GB US US HK US US US DE DE NL US US US US US CA CA FR FR DK CA GB AU AU IE LT PT AT US US US US US US US US US US US US US SG NL NL IT NL GB US US US NZ US GB GB US US US US ES IE ES
[66] GB IE US US US US IE GB GB GB GB DE …Run Code Online (Sandbox Code Playgroud) 原始标题"如何替换字符串"更新为"修复编码",因为这是这里回答的问题.
> sessionInfo()
R version 3.1.1 (2014-07-10)
Platform: x86_64-w64-mingw32/x64 (64-bit)
locale:
[1] LC_COLLATE=English_United States.1252 LC_CTYPE=English_United States.1252 LC_MONETARY=English_United States.1252 LC_NUMERIC=C
[5] LC_TIME=English_United States.1252
attached base packages:
[1] stats graphics grDevices utils datasets methods base
other attached packages:
[1] countrycode_0.17 dplyr_0.2
loaded via a namespace (and not attached):
[1] assertthat_0.1 magrittr_1.0.1 parallel_3.1.1 Rcpp_0.11.3 tools_3.1.1
Run Code Online (Sandbox Code Playgroud)
从Web源导入期间,我有一个包含某些错误的数据框.我正在寻找那些我认为正确的字符串替换,我正在学习R和dplyr所以知道如何做到这一点可能会帮助我解决更大的清理数据问题.
请在第20和第31行找到带错误的图像,我们看到"Universitat"而不是"Universitat"和"LinkÃping"而不是"Linkaping"
我知道我可以查找行和列并尝试替换它们,但是如果数据帧或数据集较大,我将无法找到所有实例.
因为我知道差异,我想要搜索单词本身并替换它.只是这个词.我知道它是字符串的一部分.但是我仍然只想处理字符串的那一部分,我可以这样做吗?
任何帮助表示赞赏,如果你能为这个问题所有可能的方法和解决方案既简单又复杂,我也将不胜感激,这将有助于我更快地学习,谢谢,
name country
1 TU Dortmund Germany
2 TU Dortmund Germany
3 Maastricht University Netherlands
4 University of the Fraser Valley Canada
5 Queen's …Run Code Online (Sandbox Code Playgroud)