使用 R 将 Excel (.xlsx) 工作表打印/保存为 PDF

Mar*_*ann 5 excel dcom r xlsx

我想在操作后将Excel文件打印到pdf文件中。对于操作,我使用了.xlsx运行良好的包。有一个功能,printSetup但我找不到开始打印的功能。有解决方案吗?

library(xlsx)
file <- "test.xlsx"
wb <- loadWorkbook(file)  
sheets <- getSheets(wb)       # get all sheets
sheet <- sheets[[1]]          # get first sheet
# HERE: MAGIC TO SAVE THIS SHEET TO PDF
Run Code Online (Sandbox Code Playgroud)

它可能是通过包使用DCOM的解决方案RDCOMClient,但我更喜欢平台独立的解决方案(例如使用xlsx),因为我在 MacOS 上工作。有任何想法吗?

Mar*_*ann 5

下面是DCOM通过RDCOMClient. 这不是我的首选解决方案,因为它仅适用于 Windows。独立于平台的解决方案仍将受到赞赏。

library(RDCOMClient)
library(R.utils)

file <- "file.xlsx"                   # relative path to Excel file
ex <- COMCreate("Excel.Application")  # create COM object
file <- getAbsolutePath(file)         # convert to absolute path
book <- ex$workbooks()$Open(file)     # open Excel file
sheet <- book$Worksheets()$Item(1)    # pointer to first worksheet
sheet$Select()                        # select first worksheet
ex[["ActiveSheet"]]$ExportAsFixedFormat(Type=0,    # export as PDF
                                        Filename="my.pdf", 
                                        IgnorePrintAreas=FALSE)
ex[["ActiveWorkbook"]]$Save()         # save workbook
ex$Quit()                             # close Excel
Run Code Online (Sandbox Code Playgroud)


Nic*_*edy 3

一种开源且跨平台的方法是使用 libreoffice,如下所示:

library("XLConnect")
x <- rnorm(1:100)
y <- x ^ 2
writeWorksheetToFile("test.xlsx", data.frame(x = x, y = y), "Data")
tmpDir <- file.path(tempdir(), "LOConv")
system2("libreoffice", c(paste0("-env:UserInstallation=file://", tmpDir), "--headless", "--convert-to pdf",
    "--outdir", getwd(), file.path(getwd(),"test.xlsx")))
Run Code Online (Sandbox Code Playgroud)

理想情况下,您可以删除 tmpDir 引用的文件夹,但这将是特定于平台的。

请注意,这假设 libreoffice 在您的路径中。如果不是,则需要更改命令以包含 libreoffice 可执行文件的完整路径。

env 位的原因是 headless libreoffice 只有在尚未以 GUI 模式运行时才会执行任何其他操作。有关更多信息,请参阅http://ask.libreoffice.org/en/question/1686/how-to-not-connect-to-a-running-instance/ 。