小编Jam*_*igh的帖子

R网页抓取多个页面

我正在开展网络抓取计划,以搜索特定的葡萄酒,并返回该品种的当地葡萄酒清单.我遇到的问题是多页结果.下面的代码是我正在使用的基本示例

url2 <- "http://www.winemag.com/?s=washington+merlot&search_type=reviews"
htmlpage2 <- read_html(url2)
names2 <- html_nodes(htmlpage2, ".review-listing .title")
Wines2 <- html_text(names2)
Run Code Online (Sandbox Code Playgroud)

对于此特定搜索,有39页的结果.我知道网址更改为http://www.winemag.com/?s=washington%20merlot&drink_type=wine&page=2,但是有一种简单的方法可以使代码循环遍历所有返回的页面并编译所有39个结果页面成一个列表?我知道我可以手动完成所有网址,但这看起来有点矫枉过正.

html r web-scraping rvest

7
推荐指数
2
解决办法
9341
查看次数

标签 统计

html ×1

r ×1

rvest ×1

web-scraping ×1