嗨,我正在 Rstudio 中使用 xml。目标是将 xml 转换为 r 数据框,我正在尝试包文件夹中名为tides.xml 的示例数据。
tides = system.file("exampleData", "tides.xml", package = "XML")
也许我们可以看到前几列中的项目是恒定的:
像这样的东西
                       origin
                   NOAA/NOS/CO-OPS
                   NOAA/NOS/CO-OPS
                   NOAA/NOS/CO-OPS
                   NOAA/NOS/CO-OPS
                   NOAA/NOS/CO-OPS
                   NOAA/NOS/CO-OPS
                   NOAA/NOS/CO-OPS
因此当我使用
xmlToDataFrame(xmlRoot(tides.str))
它返回错误:
Error in `[<-.data.frame`(`*tmp*`, i, names(nodes[[i]]), value = c("2010/11/13Sat06:08    AM4.74H",  : 
duplicate subscripts for columns
我知道我可以做这样的事情:
xmlToDataFrame(nodes = xmlChildren(xmlRoot(tides.str)[["data"]]))
生成数据框,但它只是一个子集,我需要手动插入前几列。
所以我在想有什么办法可以通过更改 xmlToDataFrame() 函数中的一些参数并使用整个 xml 数据来消除错误?
提前致谢。