我正在尝试从以下网页http://ipt.humboldt.org.co/中提取"Specimen"类型的链接.我可以使用以下代码从网页上获取表格:
library(XML)
sitePage<-htmlParse("http://ipt.humboldt.org.co/")
tableNodes<-getNodeSet(sitePage,"//table")
siteTable<-readHTMLTable(tableNodes[[1]])
Run Code Online (Sandbox Code Playgroud)
但是,在使用readHTML命令后,链接丢失了.