如何在R(read_excel)中未读隐藏excel表?

Tus*_*Lad 6 r xlsx

想知道是否有任何方法或技术可以忽略excel工作簿(read_excel)中隐藏的excel_sheet。

为什么我要问的是,在许多工作表中隐藏了许多 Excel 文件。

到目前为止我已经尝试过的链接如下。

从 Excel 导入时如何忽略隐藏数据

感谢任何帮助。

r2e*_*ans 9

这是一个函数,它会通知您要使用的任何函数,无论是否使用readxl::read_excel。(我已经用几个.xlsx文件对此进行了测试,但没有什么广泛的。)

这需要xml2包。

xlsx_sheet_info <- function(filename) {
  stopifnot(file.exists(filename))
  tmpdir <- tempfile(pattern = "xldir")
  fn <- try(
    utils::unzip(filename, files = "xl/workbook.xml", exdir = tmpdir, junkpaths = TRUE),
    silent = TRUE)
  if (inherits(fn, "try-error")) stop("unable to find 'xl/workbook.xml'")
  on.exit({
    # clean up our temporary directory used to extract the file
    if (dir.exists(tmpdir)) {
      suppressWarnings(unlink(tmpdir, recursive = TRUE, force = TRUE))
    }
  })
  xml <- try(xml2::read_xml(fn), silent = TRUE)
  if (inherits(xml, "try-error")) stop("unable to parse xml")
  # everything we want in sheets is stored as element attributes
  sheets <- lapply(xml2::as_list(xml)$workbook$sheets, attributes)
  nms <- unique(unlist(lapply(sheets, names)))
  out <- do.call(rbind.data.frame, lapply(sheets, function(sh) {
    # I believe attributes will always be 'character'
    sh[setdiff(nms, names(sh))] <- NA_character_
    # return them in-order, safe for 'rbind.data.frame'
    sh[nms]
  }))
  out[] <- lapply(out, type.convert, as.is = TRUE)
  out
}
Run Code Online (Sandbox Code Playgroud)

我创建了一个简单的工作簿中的三个工作,与各级“隐藏的” -ness的:xlSheetVisiblexlSheetHidden,和xlSheetVeryHidden(每Excel的VBA枚举)。

info <- xlsx_sheet_info("Book1.xlsx")
info
#          name sheetId   id      state
# sheet  Sheet1       1 rId1       <NA>
# sheet1 Sheet3       3 rId2 veryHidden
# sheet2 Sheet2       2 rId3     hidden
Run Code Online (Sandbox Code Playgroud)

这是 a data.frame,因此您可以使用is.na(info$state)(或grepfor "hidden")通过name或选择特定行sheetId(我假设这些是单调整数,与readxl::read_xlsx和朋友兼容)。

我不会像这里建议的那样假设工作表的顺序保留在行中。事实上,我按顺序创建了工作表:可见、隐藏、非常隐藏。