小编Bar*_*ssk的帖子

R 中的 Google 图片网页抓取

我出于不同目的使用“rvest”包进行网络抓取。现在我需要使用它从谷歌图像获取图像对象（png）的来源。我已经尝试过此链接上的解决方案：Web scraping of image。它正是我想做的。所以我想出了下面的代码，但我的 html_nodes 函数得到空对象。

library("rvest")
page <- read_html("https://www.google.com.tr/search?q=manitou&espv=2&biw=1366&bih=662&source=lnms&tbm=isch&sa=X&ved=0ahUKEwjCnJ6H2ITRAhWCQBoKHfQ5DUAQ_AUIBigB#tbm=isch&q=apple+logo+png")
node <- html_nodes(page,xpath='//*[@id="rg_s"]/div[1]/a/img')
src <-  html_attr(node,"src")

Run Code Online (Sandbox Code Playgroud)

我还尝试了 css 选择器和图像的名称，因为它是在我上面给出的链接上完成的。我的节点对象在任何方面都是空的。我还应该指出，我想抓取链接上第一个图像的源，该图像具有我上面写的 xpath。先感谢您。

html xpath r image web-scraping

Bar*_*ssk

2017 06-26

4
推荐指数

1
解决办法

2368
查看次数