如何更改“ ” R 中的字符到普通空格

iPr*_*ate 1 html string r stringr

我使用 R 进行网页抓取,并且有一个脚本可以复制链接的文本,然后使用该字符串通过 RSelenium 跟踪链接。不幸的是,当我运行脚本时,这似乎不适用于某个特定字符串,但是当我用手动输入的字符串替换保存的字符串时,它工作正常。稍微深入研究一下页面的 html 就会发现其中一个空格字符实际上是一个字符,这就是字符串无法匹配的原因。如何在 R 中替换为普通空格?我尝试使用 stringr 库和 str_replace 命令,如下所示:

var1 <- str_replace(var1, pattern = "&nbsp;", " ")
Run Code Online (Sandbox Code Playgroud)

但这似乎不起作用。我明显做错了什么吗?有没有办法让 R 显示一个字符串,其中所有奇怪的格式字符都可见?

小智 5

你需要\u00A0as 替换 char 所以var1 <- gsub("\u00A0", "", var1, fixed =TRUE)