小编Mar*_*arc的帖子

用 R 替换多个文件中的多个字符串

我在一个文件夹中有大约 700,000 个文件，我需要在其中查找多个字符串并将其替换为不同的其他字符串（所有 4 个字符代码）。不确定文件中是否存在字符串。我正在尝试使用 gsub，但我找不到如何使用正则表达式进行操作。有人可以告诉我处理这项任务的好方法吗？

这是我到目前为止使用的代码。它只适用于一条y <- gsub(...)指令，但不适用于我的目的，显然是因为在定义 y 变量时只考虑了最后一条 gsub 指令......

chm_files <- list.files(getwd(), pattern=("^[[:digit:]]*.chm$"), full.names=F)

for(chm_file in chm_files) {
  x <- readLines(chm_file)
  y <- gsub("AG02|AG07|AG05|AG18|AG19|AG08|AG09|AG17", "AGRL", x)
  y <- gsub("SB28|SB42|SB43|SB33|SB41|SB34|SB39|SB35", "SWHT", x)
  y <- gsub("WB28|WB42|WB43|WB32|WB09|WB33|WB41|WB26", "BARL", x)
  y <- gsub("WW02|WW25|WW08|WW31|WW05|WW28|WW19|WW42", "WWHT", x)
  cat(y, file=chm_file, sep="\n")
}

Run Code Online (Sandbox Code Playgroud)

r file-management gsub

Mar*_*arc

2020 02-11

5
推荐指数

1
解决办法

2319
查看次数

在 R 包文档文件（.Rd 文件）中编写符号

有没有办法在这些文档文件中包含符号？特别是，我需要包含一个“度数符号”（°）来指示我想要包含和记录的数据集的坐标（例如 55°32'32”）。

当我当前包含这样的符号时，文档文件会插入一个“Â”字符（例如55°32'32”）。

也许我错过了一些东西，但我在“编写 R 扩展”手册中没有发现关于这种可能性的任何内容。

谢谢

Mar*_*arc

lucky-day

5
推荐指数

1
解决办法

1080
查看次数

数据表中变量的唯一组合的总和

我有一个数据表,其格式代表了许多关系类别的国家之间的关系强度:

Country1    Country2     Value     Category
A           A            4         1
A           B            2         1
A           C            9         1
B           A            3         2
B           D            4         1
C           A            2         2
D           C            7         2
...

Run Code Online (Sandbox Code Playgroud)

现在我想总结每个类别的所有相互关系(例如AB和BA; DC和CD等......)(AB和BA需要"合并").

什么可以是一个简洁和"非常R"的解决方案呢？有没有现成的功能可以做到这一点？

现在,我已经为"Country1"和"Country2"列设置了一个键,但是没有找到我接下来要匹配相应行的内容.

谢谢你的任何线索.

r data.table

Mar*_*arc

2015 09-23

1
推荐指数

1
解决办法

780
查看次数