uli*_*a2_ 4 bash curl web-scraping
我正在尝试编写一个 bash 脚本来访问 SSRN 上的期刊概述页面。
我正在尝试使用curl
它,它在其他网页上适用于我,但error code: 1020
如果我尝试运行以下代码,它会返回给我:
curl https://papers.ssrn.com/sol3/papers.cfm?abstract_id=1925128
Run Code Online (Sandbox Code Playgroud)
我认为这可能与 URL 中的问号有关,但我让它可以与包含问号的其他页面一起使用。
它可能与页面允许执行的操作有关。不过,我也可以使用 R 的rvest
包访问该页面,所以我认为它通常也可以使用 bash 工作。
看起来该网站已阻止通过curl 进行访问。更改用户代理,它应该可以正常工作,即
curl --user-agent 'Chrome/79' "https://papers.ssrn.com/sol3/papersstract_id=1925128"
Run Code Online (Sandbox Code Playgroud)
归档时间: |
|
查看次数: |
8976 次 |
最近记录: |