小编cam*_*333的帖子

网页抓取

我正在尝试使用r包rvest中的read_html来获取数据表。

我试过下面的代码:

library(rvest)
  raw <- read_html("https://demanda.ree.es/movil/peninsula/demanda/tablas/2016-01-02/2")
Run Code Online (Sandbox Code Playgroud)

我不认为上述内容是从表格中提取数据的,因为我看到“原始”是2的列表:

'node:<externalptr>' and  'doc:<externalptr>'
Run Code Online (Sandbox Code Playgroud)

我也尝试过使用xpath:

html_nodes(raw,xpath = '//*[(@id = "tabla_generacion")]//*[contains(concat( " ", @class, " " ), concat( " ", "ng-scope", " " ))]')
Run Code Online (Sandbox Code Playgroud)

关于下一步尝试的任何建议?

谢谢。

r web-scraping rvest

2
推荐指数
1
解决办法
1619
查看次数

标签 统计

r ×1

rvest ×1

web-scraping ×1