小编Bar*_*ssk的帖子

R 中的 Google 图片网页抓取

我出于不同目的使用“rvest”包进行网络抓取。现在我需要使用它从谷歌图像获取图像对象(png)的来源。我已经尝试过此链接上的解决方案:Web scraping of image。它正是我想做的。所以我想出了下面的代码,但我的 html_nodes 函数得到空对象。

library("rvest")
page <- read_html("https://www.google.com.tr/search?q=manitou&espv=2&biw=1366&bih=662&source=lnms&tbm=isch&sa=X&ved=0ahUKEwjCnJ6H2ITRAhWCQBoKHfQ5DUAQ_AUIBigB#tbm=isch&q=apple+logo+png")
node <- html_nodes(page,xpath='//*[@id="rg_s"]/div[1]/a/img')
src <-  html_attr(node,"src")
Run Code Online (Sandbox Code Playgroud)

我还尝试了 css 选择器和图像的名称,因为它是在我上面给出的链接上完成的。我的节点对象在任何方面都是空的。我还应该指出,我想抓取链接上第一个图像的源,该图像具有我上面写的 xpath。先感谢您。

html xpath r image web-scraping

4
推荐指数
1
解决办法
2368
查看次数

标签 统计

html ×1

image ×1

r ×1

web-scraping ×1

xpath ×1