New*_*mer 2 python url web-scraping python-3.x python-requests
如何使用 Python 检查给定的 url 是否可下载?
True如果它是可下载的,它应该返回False
不可下载的 url 示例: www.google.com
注意:我不是在谈论 URL 的内容并将其保存为网页。
什么是可下载的 URL?
如果您重定向到一个 URL 并且一个文件开始下载,那么它就是一个可下载的 url
示例: https : //drive.google.com/uc?id=1QOMVDpd8hcVYqqUXDXf68UMDWQZP0wQV&export=download
注:下载 stackoverflow 年度调查 2019 数据集。
这可以通过使用流行的请求库来完成
import requests
url = 'https://www.google.com'
headers=requests.head(url).headers
downloadable = 'attachment' in headers.get('Content-Disposition', '')
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
2091 次 |
| 最近记录: |