小编Mar*_*arc的帖子

用 R 替换多个文件中的多个字符串

我在一个文件夹中有大约 700,000 个文件,我需要在其中查找多个字符串并将其替换为不同的其他字符串(所有 4 个字符代码)。不确定文件中是否存在字符串。我正在尝试使用 gsub,但我找不到如何使用正则表达式进行操作。有人可以告诉我处理这项任务的好方法吗?

这是我到目前为止使用的代码。它只适用于一条y <- gsub(...)指令,但不适用于我的目的,显然是因为在定义 y 变量时只考虑了最后一条 gsub 指令......

chm_files <- list.files(getwd(), pattern=("^[[:digit:]]*.chm$"), full.names=F)

for(chm_file in chm_files) {
  x <- readLines(chm_file)
  y <- gsub("AG02|AG07|AG05|AG18|AG19|AG08|AG09|AG17", "AGRL", x)
  y <- gsub("SB28|SB42|SB43|SB33|SB41|SB34|SB39|SB35", "SWHT", x)
  y <- gsub("WB28|WB42|WB43|WB32|WB09|WB33|WB41|WB26", "BARL", x)
  y <- gsub("WW02|WW25|WW08|WW31|WW05|WW28|WW19|WW42", "WWHT", x)
  cat(y, file=chm_file, sep="\n")
}
Run Code Online (Sandbox Code Playgroud)

r file-management gsub

5
推荐指数
1
解决办法
2319
查看次数

在 R 包文档文件(.Rd 文件)中编写符号

有没有办法在这些文档文件中包含符号?特别是,我需要包含一个“度数符号”(°)来指示我想要包含和记录的数据集的坐标(例如 55°32'32”)。

当我当前包含这样的符号时,文档文件会插入一个“”字符(例如55°32'32”)。

也许我错过了一些东西,但我在“编写 R 扩展”手册中没有发现关于这种可能性的任何内容。

谢谢

r

5
推荐指数
1
解决办法
1080
查看次数

数据表中变量的唯一组合的总和

我有一个数据表,其格式代表了许多关系类别的国家之间的关系强度:

Country1    Country2     Value     Category
A           A            4         1
A           B            2         1
A           C            9         1
B           A            3         2
B           D            4         1
C           A            2         2
D           C            7         2
...
Run Code Online (Sandbox Code Playgroud)

现在我想总结每个类别的所有相互关系(例如AB和BA; DC和CD等......)(AB和BA需要"合并").

什么可以是一个简洁和"非常R"的解决方案呢?有没有现成的功能可以做到这一点?

现在,我已经为"Country1"和"Country2"列设置了一个键,但是没有找到我接下来要匹配相应行的内容.

谢谢你的任何线索.

r data.table

1
推荐指数
1
解决办法
780
查看次数

R:从矩阵中提取圆圈

给定一个边长为L的方阵,如何在R中提取落入能够填充矩阵的最大可能圆的所有值?

在此输入图像描述

C++的矩阵(二维数组)中找到了填充圆,但是如何测试矩阵中每个单元格的位置是否落入等式中?如何在使用申请例时知道每个单元格的X和Y?

r matrix

1
推荐指数
1
解决办法
180
查看次数

标签 统计

r ×4

data.table ×1

file-management ×1

gsub ×1

matrix ×1