小编ano*_*s13的帖子

Http - 隧道连接失败：Python 网页抓取出现 403 Forbidden 错误

我正在尝试网络抓取 http 网站，当我尝试阅读该网站时出现以下错误。

HTTPSConnectionPool(host='proxyvipecc.nb.xxxx.com', port=83): Max retries exceeded with url: http://campanulaceae.myspecies.info/ (Caused by ProxyError('Cannot connect to proxy.', OSError('Tunnel connection failed: 403 Forbidden',)))

Run Code Online (Sandbox Code Playgroud)

下面是我在类似网站上编写的代码。我尝试使用 urllib 和 user-agent 但仍然存在同样的问题。

url = "http://campanulaceae.myspecies.info/"

response = requests.get(url, headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36'})
soup = BeautifulSoup(response.text, 'html.parser')

Run Code Online (Sandbox Code Playgroud)

谁能帮我解决这个问题。提前致谢

python http-error web-scraping

ano*_*s13

2021 02-06

5
推荐指数

1
解决办法

4万
查看次数