相关疑难解决方法(0)

R:替换字符串中的外来字符

我正在处理大量数据,主要是非英文字符的名称.我的目标是将这些名称与在美国收集的一些信息相匹配.

也就是说,我可能希望将名称'Sølvsten'(从某些名称列表)与'Soelvsten'(存储在某些美国数据库中的名称)相匹配.这是我写的一个函数来做这件事.它显然很笨拙,有点随意,但我想知道是否有一个简单的R函数将这些外来字符转换为最近的英国邻居.我知道可能没有任何标准的方法来进行这种转换,但我只是好奇是否有转换可以通过R函数完成.

# a function to replace foreign characters
replaceforeignchars <- function(x)
{
    require(gsubfn);
    x <- gsub("š","s",x)
    x <- gsub("œ","oe",x)
    x <- gsub("ž","z",x)
    x <- gsub("ß","ss",x)
    x <- gsub("þ","y",x)
    x <- gsub("à","a",x)
    x <- gsub("á","a",x)
    x <- gsub("â","a",x)
    x <- gsub("ã","a",x)
    x <- gsub("ä","a",x)
    x <- gsub("å","a",x)
    x <- gsub("æ","ae",x)
    x <- gsub("ç","c",x)
    x <- gsub("è","e",x)
    x <- gsub("é","e",x)
    x <- gsub("ê","e",x)
    x <- gsub("ë","e",x)
    x <- gsub("ì","i",x)
    x <- gsub("í","i",x)
    x <- gsub("î","i",x)
    x <- gsub("ï","i",x)
    x <- gsub("ð","d",x) …
Run Code Online (Sandbox Code Playgroud)

r string-matching

10
推荐指数
3
解决办法
7349
查看次数

在R中导入带有特殊字符的数据

下图显示了在R中导入数据(记事本)之前和导入之后数据的状态。

在此处输入图片说明

我使用以下命令将其导入R:

Data <- read.csv('data.csv',stringsAsFactors = FALSE,header = TRUE,quote = "")
Run Code Online (Sandbox Code Playgroud)

可以看出,诸如ae之类的特殊字符已被替换为A |之类的东西。(第19行位于左侧,第18行位于右侧)。有没有办法按原样导入CSV文件?(使用R)

csv r character-encoding special-characters

5
推荐指数
1
解决办法
1万
查看次数