阅读和理解R中的XML

She*_*ery 3 xml r

我正在尝试从位于以下网址的XML中读取:https://d396qusza40orc.cloudfront.net/getdata%2Fdata%2Frestaurants.xml

我在R中收到以下错误:

Error: XML content does not seem to be XML: 'https://d396qusza40orc.cloudfront.net/getdata%2Fdata%2Frestaurants.xml'
Run Code Online (Sandbox Code Playgroud)

我的代码:

install.packages("XML")
library(XML)
fileURL = "https://d396qusza40orc.cloudfront.net/getdata%2Fdata%2Frestaurants.xml"
doc = xmlTreeParse(fileURL)
Run Code Online (Sandbox Code Playgroud)

我想阅读那个XML文件并找出有多少家餐馆有邮政编码21231?

谢谢

luk*_*keA 6

尝试下载xml文件:

library(XML)
fileURL <- "https://d396qusza40orc.cloudfront.net/getdata%2Fdata%2Frestaurants.xml"
download.file(fileURL, destfile=tf <- tempfile(fileext=".xml"))
doc <- xmlParse(tf)
zip <- xpathSApply(doc, "/response/row/row/zipcode", xmlValue)
sum(zip == "21231")
# [1] 127
Run Code Online (Sandbox Code Playgroud)

  • 它们是有效的,但我想https的证书验证失败了.我不知道你是否可以将`ssl.verifypeer = FALSE`传递给底层的`RCurl :: getURL`(?).但是`download.file`或`readLines`或`RCurl :: getURL(...,ssl.verifypeer = FALSE)`甚至用`http`工作交换`https`. (2认同)