Adi*_*tya 3 python web-scraping python-requests
我是 Python 新手,发现了一个下载数据并将数据保存为 demofile.csv 的代码
import requests
url = "https://example.com/demofile"
r = requests.get(url)
filename = url.split('/')[-1]
with open(filename+".csv", "wb") as code:
code.write(r.content)
Run Code Online (Sandbox Code Playgroud)
现在,我不想明确指定任何名称。 我只希望通过 Python 脚本打开该 URL,并使用默认名称和类型(我们手动下载文件时出现的名称和类型)下载文件。
另外,该文件应该保存在其他目录中,而不是保存 python 代码的文件夹中。
请在这方面提供帮助。
您需要查看“Content-Disposition”标头,请参阅 kender 的解决方案。
发布他的解决方案,修改后具有指定输出文件夹的功能:
from os.path import basename
import os
from urlparse import urlsplit
import urllib2
def url2name(url):
return basename(urlsplit(url)[2])
def download(url, out_path):
localName = url2name(url)
req = urllib2.Request(url)
r = urllib2.urlopen(req)
if r.info().has_key('Content-Disposition'):
# If the response has Content-Disposition, we take file name from it
localName = r.info()['Content-Disposition'].split('filename=')[1]
if localName[0] == '"' or localName[0] == "'":
localName = localName[1:-1]
elif r.url != url:
# if we were redirected, the real file name we take from the final URL
localName = url2name(r.url)
localName = os.path.join(out_path, localName)
f = open(localName, 'wb')
f.write(r.read())
f.close()
download("https://example.com/demofile", '/home/username/tmp')
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
6673 次 |
| 最近记录: |