这是一个开头带有 UTF-16 BOM(字节顺序标记)的 XML 文件。你可以用 R 来阅读它:
library(xml2)
library(rvest)
xls <- read_html("LU0444605991_434.xls")
values <- html_text(html_nodes(xls, xpath="//cell/data"))
dat <- data.frame(matrix(values[5:length(values)], ncol=2, byrow=TRUE),
stringsAsFactors=FALSE)
colnames(dat) <- c("datum", "nav")
dat$nav <- as.numeric(dat$nav)
head(dat)
## datum nav
## 1 2009-10-05T00:00:00 117.1047
## 2 2009-10-06T00:00:00 117.0746
## 3 2009-10-07T00:00:00 117.0915
## 4 2009-10-08T00:00:00 117.0822
## 5 2009-10-09T00:00:00 116.8312
## 6 2009-10-12T00:00:00 116.9347
Run Code Online (Sandbox Code Playgroud)
如果您确实想反复用头撞墙来处理这些 Microsoft 文档中疯狂的 XML 命名空间,那么您可以使用该xml2包(和)。read_xml
您仍然需要进行日期/时间转换和数字转换。