bul*_*ter 4 python urllib fancyurlopener
我试图从银行网站访问 PDF 文件进行 PDF 挖掘,但它不断返回 HTTP 403 错误。因此,作为解决方法,我尝试将我的用户代理更改为浏览器以访问文件(并下载它)。
下面的代码是我现在拥有的代码的一部分。这将返回以下错误:
C:\Users\Name\Anaconda3\lib\site-packages\ipykernel_launcher.py:8: DeprecationWarning: MyOpener 调用请求的风格已被弃用。使用更新的 urlopen 函数/方法
我该如何解决?
import urllib.request
my_url = 'someurl here'
class MyOpener(urllib.request.FancyURLopener):
version = 'Mozilla/5.0 (Windows; U; Windows NT 5.1; it; rv:1.8.1.11)
Gecko/20071127 Firefox/2.0.0.11'
myopener = MyOpener()
page = myopener.open(my_url)
page.read()
Run Code Online (Sandbox Code Playgroud)
小智 5
你可以试试这个:
import urllib2
def download_file(download_url):
response = urllib2.urlopen(download_url)
f = open("the_downloaded_file.pdf", 'wb')
f.write(response.read())
f.close()
download_file("some url to pdf here")
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
5010 次 |
| 最近记录: |