Mar*_*ski 6 r web-scraping rvest
由于在R中很容易,我使用rvest包来解析HTML以从网站中提取信息.
我想知道在请求期间我的用户代理是什么(如果有的话),因为用户代理被分配到互联网浏览器或有办法以某种方式设置它?
我在HTML中打开会话和提取信息的代码如下:
library(rvest)
se <- html_session( "http://www.wp.pl" ) %>%
html_nodes("[data-st-area=Glonews-mozaika] li:nth-child(7) a") %>%
html_attr( name = "href" )
Run Code Online (Sandbox Code Playgroud)
Mic*_*ohl 10
我使用https://httpbin.org/user-agent找出:
library(rvest)
se <- html_session( "https://httpbin.org/user-agent" )
se$response$request$options$useragent
Run Code Online (Sandbox Code Playgroud)
回答:
[1] "libcurl/7.37.1 r-curl/0.9.1 httr/1.0.0"
Run Code Online (Sandbox Code Playgroud)
请参阅此错误报告以获取覆盖它的方法.
| 归档时间: |
|
| 查看次数: |
3586 次 |
| 最近记录: |