如何使用 r 和 pdftools 包将多个 pdf 导入 pdf_convert?

Jor*_*an 1 pdf r data-munging

如何将多个pdf文件导入到包的pdf_convert命令中pdftools

我有一个包含多个 pdf 文件的目录。我正在使用pdftools带有pdf_convert命令的包来呈现 pdf 文档中的 jpeg。但是,没有为pattern文档设置模式的命令。

我试过了:

for(i in length(dir(folder))){
   pdf_convert("C:/folder/*.pdf", format = "jpeg")
}
Run Code Online (Sandbox Code Playgroud)

但是,这会引发一个错误,指出:

Error in normaizePath(path.expand(path), winslash, mustWork) : path[1]="C:/folder/*.pdf: The filename, director name, or volume label syntax is incorrect

当我不使用*.pdf而是使用实际文件名时,它可以工作。

如何获取读取多个文件的命令?

对不起,我没有可重现的例子。我不确定如何发布包含多个 pdf 文件的目录并在 SO 上访问它。

phi*_*ver 6

这将解决问题,不需要循环。

library(pdftools)

directory <- "C:/folder"
file.list <- paste(directory, "/",list.files(directory, pattern = "*.pdf"), sep = "")

lapply(file.list, FUN = function(files) {
  pdf_convert(files, format = "jpeg")
})
Run Code Online (Sandbox Code Playgroud)