标签: data-munging

重复3位字符序列的行值 - 整洁的数据

给出以下数据框:

df <- data.frame(start = c("005", "010", "014"),
                   end = c("005", "013", "017"),
                  zone = c(3, 5, 7))
# df
#   start end zone
# 1   005 005    3
# 2   010 013    5
# 3   014 017    7
Run Code Online (Sandbox Code Playgroud)

我想生成以下结果:

#   key zone
# 1 005    3
# 2 010    5
# 3 011    5
# 4 012    5
# 5 013    5
# 6 014    7
# 7 015    7
# 8 016    7
# 9 017    7
Run Code Online (Sandbox Code Playgroud)

我想我可以利用一些东西 …

r dplyr tidyr data-munging

1
推荐指数
1
解决办法
149
查看次数

如何使用 r 和 pdftools 包将多个 pdf 导入 pdf_convert?

如何将多个pdf文件导入到包的pdf_convert命令中pdftools

我有一个包含多个 pdf 文件的目录。我正在使用pdftools带有pdf_convert命令的包来呈现 pdf 文档中的 jpeg。但是,没有为pattern文档设置模式的命令。

我试过了:

for(i in length(dir(folder))){
   pdf_convert("C:/folder/*.pdf", format = "jpeg")
}
Run Code Online (Sandbox Code Playgroud)

但是,这会引发一个错误,指出:

Error in normaizePath(path.expand(path), winslash, mustWork) : path[1]="C:/folder/*.pdf: The filename, director name, or volume label syntax is incorrect

当我不使用*.pdf而是使用实际文件名时,它可以工作。

如何获取读取多个文件的命令?

对不起,我没有可重现的例子。我不确定如何发布包含多个 pdf 文件的目录并在 SO 上访问它。

pdf r data-munging

1
推荐指数
1
解决办法
1858
查看次数

数据清理 - 转换为tidyverse

我很好奇以下代码是否可以转换为tidyverse代码.我试过dplyr :: mutate并且无法让它工作得很好.

df$Gender[df$Gender == "M"] <- "Man"
df$Gender[df$Gender == "Male"] <- "Man"
df$Gender[df$Gender == "F"] <- "Woman"
df$Gender[df$Gender == "Female"] <- "Woman"
df$Gender[df$Gender == "M & F"] <- "Man and Woman"
df$Gender[df$Gender == "Male & Female"] <- "Man and Woman"
Run Code Online (Sandbox Code Playgroud)

r data-munging tidyverse

0
推荐指数
1
解决办法
132
查看次数

R函数增加每行的数字

我正在尝试在数据框中创建一个新列“ID”。

每行必须有一个唯一的 ID,每次递增 5。但它不应该从 0 开始,而是从所需的数字开始(假设 N = 另一个数据集列的最大值)。

最简单的方法是什么?(循环?函数?)

loops r data-munging

0
推荐指数
1
解决办法
1297
查看次数

标签 统计

data-munging ×4

r ×4

dplyr ×1

loops ×1

pdf ×1

tidyr ×1

tidyverse ×1