想知道是否有任何方法或技术可以忽略excel工作簿(read_excel)中隐藏的excel_sheet。
为什么我要问的是,在许多工作表中隐藏了许多 Excel 文件。
到目前为止我已经尝试过的链接如下。
感谢任何帮助。
这是一个函数,它会通知您要使用的任何函数,无论是否使用readxl::read_excel。(我已经用几个.xlsx文件对此进行了测试,但没有什么广泛的。)
这需要xml2包。
xlsx_sheet_info <- function(filename) {
stopifnot(file.exists(filename))
tmpdir <- tempfile(pattern = "xldir")
fn <- try(
utils::unzip(filename, files = "xl/workbook.xml", exdir = tmpdir, junkpaths = TRUE),
silent = TRUE)
if (inherits(fn, "try-error")) stop("unable to find 'xl/workbook.xml'")
on.exit({
# clean up our temporary directory used to extract the file
if (dir.exists(tmpdir)) {
suppressWarnings(unlink(tmpdir, recursive = TRUE, force = TRUE))
}
})
xml <- try(xml2::read_xml(fn), silent = TRUE)
if (inherits(xml, "try-error")) stop("unable to parse xml")
# everything we want in sheets is stored as element attributes
sheets <- lapply(xml2::as_list(xml)$workbook$sheets, attributes)
nms <- unique(unlist(lapply(sheets, names)))
out <- do.call(rbind.data.frame, lapply(sheets, function(sh) {
# I believe attributes will always be 'character'
sh[setdiff(nms, names(sh))] <- NA_character_
# return them in-order, safe for 'rbind.data.frame'
sh[nms]
}))
out[] <- lapply(out, type.convert, as.is = TRUE)
out
}
Run Code Online (Sandbox Code Playgroud)
我创建了一个简单的工作簿中的三个工作,与各级“隐藏的” -ness的:xlSheetVisible,xlSheetHidden,和xlSheetVeryHidden(每Excel的VBA枚举)。
info <- xlsx_sheet_info("Book1.xlsx")
info
# name sheetId id state
# sheet Sheet1 1 rId1 <NA>
# sheet1 Sheet3 3 rId2 veryHidden
# sheet2 Sheet2 2 rId3 hidden
Run Code Online (Sandbox Code Playgroud)
这是 a data.frame,因此您可以使用is.na(info$state)(或grepfor "hidden")通过name或选择特定行sheetId(我假设这些是单调整数,与readxl::read_xlsx和朋友兼容)。
我不会像这里建议的那样假设工作表的顺序保留在行中。事实上,我按顺序创建了工作表:可见、隐藏、非常隐藏。