Web在R中抓取：从`href`标签中提取名称

Lau*_*ura 5 r web-scraping

这是我的代码：

library(rvest)
library(XML)
library(xml2)
url_imb <- 'https://www.imdb.com/search/title/?count=100&release_date=2016,2016&title_type=feature'
web_page<-read_html(url_imb)

Run Code Online (Sandbox Code Playgroud)

我想提取所有与adv_li_dr_0标签相关的Directors名称。

这就是我所做的：CSS SELECTOR：

directors_0<-html_text(html_nodes(web_page,"p a"))

Run Code Online (Sandbox Code Playgroud)

XPATH选择器：

directors_0<-html_attr(html_nodes(web_page,xpath='//p[@class=""]//a'),"href")

Run Code Online (Sandbox Code Playgroud)

当然是不完整的。但是你能帮我吗？如何提取与标签中有关的元素href。

归档时间：	6 年，2 月前
查看次数：	60 次
最近记录：	6 年，2 月前

如何在ggplot2图中抑制垂直网格线？ 68

如何在R/Splus中创建名称但没有条目的列表？ 41

将Data.frames列表重新组合到单个数据框中 30

与dplyr R的笛卡尔积 20

绘制相关系数时GGally :: ggpairs绘图没有网格线 16

使用tm-package进行文本挖掘 - 词干 11

ggplot2与其他功能(R)之间的加号 11

获取列名称,该列名称在矩阵的行中保存最大值,该矩阵在数组中保持单独的最大值 10

在scrapy网络爬虫中获取错误 4

Python Scrapy解析与另一个函数的提取链接 4

Python有三元条件运算符吗？ 5591

如何测试私有函数或具有私有方法,字段或内部类的类？ 2593

在JavaScript中编码URL？ 2392

静态类和单例模式之间的区别？ 1708

如何显示JavaScript对象？ 1520

如何创建文件并用Java写入？ 1336

在关系数据库中存储分层数据有哪些选项？ 1281

CSS calc()函数中的Sass变量 1182

什么是在Vim中评论/取消注释行的快速方法？ 1081

删除目录的符号链接 1063