相关疑难解决方法(0)

屏幕抓取:绕过"HTTP错误403:robots.txt禁止请求"

有办法解决以下问题吗?

httperror_seek_wrapper: HTTP Error 403: request disallowed by robots.txt
Run Code Online (Sandbox Code Playgroud)

是唯一的方法来联系网站所有者(barnesandnoble.com)..我正在建立一个网站,将带来更多的销售,不知道为什么他们会拒绝在一定深度访问.

我在Python2.6上使用了mechanize和BeautifulSoup.

希望能够解决问题

python screen-scraping mechanize beautifulsoup http-status-code-403

45
推荐指数
4
解决办法
4万
查看次数