我似乎无法开始html_table()工作.
这是一个很好的例子:(试图刮掉6场比赛:桌子)
library(rvest)
hockey <- html("http://www.hockey-reference.com/boxscores/2015/3/6/")
hockey %>%
html_nodes("#stats .tooltip , #stats td , #stats a") %>%
html_table()
Run Code Online (Sandbox Code Playgroud)
但我得到了一个html_tag(x) == "table" is not TRUE.它显然是一张桌子.
我怎样才能强迫rvest将节点识别为一个表?
尝试:
hockey %>% html_table(fill = TRUE)
Run Code Online (Sandbox Code Playgroud)
解析页面上的所有表格,或
hockey %>% html_nodes("#stats") %>% html_table()
Run Code Online (Sandbox Code Playgroud)
解析你所追求的第一个.