尝试在Python3中使用fancyURLopener来处理PDF,但它给了我一个DeprecationWarning错误

bul*_*ter 4 python urllib fancyurlopener

我试图从银行网站访问 PDF 文件进行 PDF 挖掘,但它不断返回 HTTP 403 错误。因此,作为解决方法,我尝试将我的用户代理更改为浏览器以访问文件(并下载它)。

下面的代码是我现在拥有的代码的一部分。这将返回以下错误:

C:\Users\Name\Anaconda3\lib\site-packages\ipykernel_launcher.py:8: DeprecationWarning: MyOpener 调用请求的风格已被弃用。使用更新的 urlopen 函数/方法

我该如何解决?

import urllib.request

my_url = 'someurl here'

class MyOpener(urllib.request.FancyURLopener):
    version = 'Mozilla/5.0 (Windows; U; Windows NT 5.1; it; rv:1.8.1.11) 
Gecko/20071127 Firefox/2.0.0.11'

myopener = MyOpener()

page = myopener.open(my_url)
page.read()
Run Code Online (Sandbox Code Playgroud)

小智 5

你可以试试这个:

import urllib2

def download_file(download_url):
    response = urllib2.urlopen(download_url)
    f = open("the_downloaded_file.pdf", 'wb')
    f.write(response.read())
    f.close()

download_file("some url to pdf here")
Run Code Online (Sandbox Code Playgroud)