尝试使用 bash 脚本抓取页面时出现curl 1020错误

Question

我正在尝试编写一个 bash 脚本来访问 SSRN 上的期刊概述页面。

我正在尝试使用curl它，它在其他网页上适用于我，但error code: 1020如果我尝试运行以下代码，它会返回给我：

curl https://papers.ssrn.com/sol3/papers.cfm?abstract_id=1925128

我认为这可能与 URL 中的问号有关，但我让它可以与包含问号的其他页面一起使用。

它可能与页面允许执行的操作有关。不过，我也可以使用 R 的rvest包访问该页面，所以我认为它通常也可以使用 bash 工作。

Answer 1

看起来该网站已阻止通过curl 进行访问。更改用户代理，它应该可以正常工作，即

curl --user-agent 'Chrome/79' "https://papers.ssrn.com/sol3/papersstract_id=1925128"