如何在R中打开文件格式和文件扩展名不同的excel文件?

sta*_*guy 1 xml excel warnings r package

我有一个 Excel 文件,当我想打开它时,会出现以下警告消息:

您尝试打开的文件“name.ext”的格式与文件扩展名指定的格式不同。打开文件之前,请验证文件是否未损坏且来源可靠。您想现在打开该文件吗?

当我单击“是”打开它时,一切都很好。但是,我想在 R 中读取此文件,尽管有警告,但无法管理 R 加载内容。我怎样才能实现这个目标?

我想用 R 打开的文件示例可以在此处下载。我使用微软 Office 2016。

hrb*_*str 5

这是一个开头带有 UTF-16 BOM(字节顺序标记)的 XML 文件。你可以用 R 来阅读它:

library(xml2)
library(rvest)

xls <- read_html("LU0444605991_434.xls")
values <- html_text(html_nodes(xls, xpath="//cell/data"))
dat <- data.frame(matrix(values[5:length(values)], ncol=2, byrow=TRUE), 
                  stringsAsFactors=FALSE)
colnames(dat) <- c("datum", "nav")
dat$nav <- as.numeric(dat$nav)

head(dat)
##                 datum      nav
## 1 2009-10-05T00:00:00 117.1047
## 2 2009-10-06T00:00:00 117.0746
## 3 2009-10-07T00:00:00 117.0915
## 4 2009-10-08T00:00:00 117.0822
## 5 2009-10-09T00:00:00 116.8312
## 6 2009-10-12T00:00:00 116.9347
Run Code Online (Sandbox Code Playgroud)

如果您确实想反复用头撞墙来处理这些 Microsoft 文档中疯狂的 XML 命名空间,那么您可以使用该xml2包(和)。read_xml

您仍然需要进行日期/时间转换和数字转换。