我想打开一个网址urllib.request.urlopen('someurl'):
with urllib.request.urlopen('someurl') as url:
b = url.read()
Run Code Online (Sandbox Code Playgroud)
我一直收到以下错误:
urllib.error.HTTPError: HTTP Error 403: Forbidden
Run Code Online (Sandbox Code Playgroud)
我理解错误是由于网站不让python访问它,阻止机器人浪费他们的网络资源 - 这是可以理解的.我去搜索,发现你需要更改urllib的用户代理.但是我在这个问题上找到的关于如何更改用户代理的所有指南和解决方案都是使用urllib2,而我使用的是python 3,因此所有解决方案都不起作用.
我怎么能用python 3解决这个问题?
很抱歉,标题不是很清楚,基本上我有一个列表,其中包含一系列网址,目的是下载图片.反正有没有检查网页是否是一个图像,所以我可以跳过那些不是?
提前致谢