小编Jor*_*uez的帖子

从html表中提取链接

我正在尝试从以下网页http://ipt.humboldt.org.co/中提取"Specimen"类型的链接.我可以使用以下代码从网页上获取表格:

library(XML)
sitePage<-htmlParse("http://ipt.humboldt.org.co/")
tableNodes<-getNodeSet(sitePage,"//table")
siteTable<-readHTMLTable(tableNodes[[1]])
Run Code Online (Sandbox Code Playgroud)

但是,在使用readHTML命令后,链接丢失了.

html xml r web-scraping

8
推荐指数
2
解决办法
2595
查看次数

标签 统计

html ×1

r ×1

web-scraping ×1

xml ×1