如何使用Python下载pdf文件？

Question

如何使用Python下载pdf文件？

tir*_*tic 6 python pdf download downloading-website-files python-2.7

我正在寻找一种在 python 中下载 pdf 文件的方法，并且我看到了推荐 urllib 模块的其他问题的答案。我尝试使用它下载 pdf 文件，但是当我尝试打开下载的文件时，会显示一条消息，提示无法打开该文件。

这是我使用的代码-

import urllib
urllib.urlretrieve("http://papers.gceguide.com/A%20Levels/Mathematics%20(9709)/9709_s11_qp_42.pdf", "9709_s11_qp_42.pdf")

Run Code Online (Sandbox Code Playgroud)

我究竟做错了什么？此外，该文件会自动保存到我的 python 文件所在的目录中。如何更改保存它的位置？

编辑 - 我再次尝试使用示例 pdf 的链接，http://unec.edu.az/application/uploads/2014/12/pdf-sample.pdf

该代码正在使用此链接，那么为什么它不适用于另一个链接呢？

Answer 1

小智 9

尝试这个。有用。

import requests
url='https://pdfs.semanticscholar.org/c029/baf196f33050ceea9ecbf90f054fd5654277.pdf'
r = requests.get(url, stream=True)

with open('C:/Users/MICRO HARD/myfile.pdf', 'wb') as f:
f.write(r.content)

Run Code Online (Sandbox Code Playgroud)

Answer 2

Kar*_* KR 0

您无法使用 requests或从给定的 URL 下载 pdf 内容urllib。
因为最初给定的 url 被指向另一个网页，之后才加载 pdf。
如果您有疑问，请将回复保存为 html 而不是 pdf。
您需要使用无头浏览器，例如panthomJS从此类网页下载文件。

归档时间：	9 年前
查看次数：	14874 次
最近记录：	5 年，4 月前