小编Jav*_*zzi的帖子

Rvest 从选择中提取选项值和文本

Rvest 选择选项,我认为用一个可重现的例子来解释是最容易的

网站:http : //www.verema.com/vinos/portada 我想获取葡萄酒的类型(Tipos de vinos),在 html 代码中是:

<select class="campo select" id="producto_tipo_producto_id" name="producto[tipo_producto_id]">
<option value="">Todos</option>
<option value="211">Tinto</option>
<option value="213">Blanco</option>
<option value="215">Rosado</option>
<option value="216">Espumoso</option>
<option value="217">Dulces y Generosos</option></select>

XPath :  //*[@id="producto_tipo_producto_id"]  or
CSS : #producto_tipo_producto_id  or
Class: campo select
Run Code Online (Sandbox Code Playgroud)

我想要一个 data.frame 作为

211 丁托

213 布兰科

215 罗萨多

第216章

第217话

我的代码(R):

library(rvest)

Pagina.R <- html(x = "http://www.verema.com/vinos/portada")

text <- Pagina.R %>% 
  html_nodes(xpath='//*[@id="producto_tipo_producto_id"]')%>%
  html_text() 
text

values <- Pagina.R %>% 
  html_nodes(xpath='//*[@id="producto_tipo_producto_id"]')%>%
  html_attr("option value")       #problem????
values

Res <- data.frame(text = text, …
Run Code Online (Sandbox Code Playgroud)

r web-scraping rvest

6
推荐指数
1
解决办法
2274
查看次数

标签 统计

r ×1

rvest ×1

web-scraping ×1