我在一个文件夹中有大约 700,000 个文件,我需要在其中查找多个字符串并将其替换为不同的其他字符串(所有 4 个字符代码)。不确定文件中是否存在字符串。我正在尝试使用 gsub,但我找不到如何使用正则表达式进行操作。有人可以告诉我处理这项任务的好方法吗?
这是我到目前为止使用的代码。它只适用于一条y <- gsub(...)
指令,但不适用于我的目的,显然是因为在定义 y 变量时只考虑了最后一条 gsub 指令......
chm_files <- list.files(getwd(), pattern=("^[[:digit:]]*.chm$"), full.names=F)
for(chm_file in chm_files) {
x <- readLines(chm_file)
y <- gsub("AG02|AG07|AG05|AG18|AG19|AG08|AG09|AG17", "AGRL", x)
y <- gsub("SB28|SB42|SB43|SB33|SB41|SB34|SB39|SB35", "SWHT", x)
y <- gsub("WB28|WB42|WB43|WB32|WB09|WB33|WB41|WB26", "BARL", x)
y <- gsub("WW02|WW25|WW08|WW31|WW05|WW28|WW19|WW42", "WWHT", x)
cat(y, file=chm_file, sep="\n")
}
Run Code Online (Sandbox Code Playgroud) 有没有办法在这些文档文件中包含符号?特别是,我需要包含一个“度数符号”(°)来指示我想要包含和记录的数据集的坐标(例如 55°32'32”)。
当我当前包含这样的符号时,文档文件会插入一个“”字符(例如55°32'32”)。
也许我错过了一些东西,但我在“编写 R 扩展”手册中没有发现关于这种可能性的任何内容。
谢谢
我有一个数据表,其格式代表了许多关系类别的国家之间的关系强度:
Country1 Country2 Value Category
A A 4 1
A B 2 1
A C 9 1
B A 3 2
B D 4 1
C A 2 2
D C 7 2
...
Run Code Online (Sandbox Code Playgroud)
现在我想总结每个类别的所有相互关系(例如AB和BA; DC和CD等......)(AB和BA需要"合并").
什么可以是一个简洁和"非常R"的解决方案呢?有没有现成的功能可以做到这一点?
现在,我已经为"Country1"和"Country2"列设置了一个键,但是没有找到我接下来要匹配相应行的内容.
谢谢你的任何线索.