aws*_*ott 3 python encoding python-requests fedora-commons
我正在尝试使用 Python 中的请求库将文件上传到本地主机上的 Fedora 公共存储库。我相当肯定我的主要问题是不理解open()/read()以及我需要做什么才能通过 http 请求发送数据。
def postBinary(fileName,dirPath,url):
path = dirPath+'/'+fileName
print('to ' + url + '\n' + path)
openBin = {'file':(fileName,open(path,'rb').read())}
headers = {'Slug': fileName} #not important
r = requests.put(url, files=openBin,headers=headers, auth=HTTPBasicAuth('username', 'pass'))
print(r.text)
print("and the url used:")
print(r.url)
Run Code Online (Sandbox Code Playgroud)
这将成功上传存储库中的文件,但之后它会稍大并损坏。例如,一个 6.6kb 的图像变成了 6.75kb 并且不再可以打开。
那么我应该如何使用 put in python 正确打开和上传文件?###额外的细节:###
当我替换files=openBin为data=openBin我的字典时,我将数据假定为字符串。我不知道这些信息是否有帮助。
"file=FILE_NAME.extension&file=TYPE89a%24%02Q%03%E7%FF%00E%5B%19%FC%....并且文件的大小增加到若干兆字节
我特别使用 put 因为 Fedora RESTful HTTP API 端点说要使用put.
以下命令确实有效:
curl -u username:password -H "Content-Type: text/plain" -X PUT -T /path/to/someFile.jpeg http://localhost:8080/fcrepo/rest/someFile.jpeg
更新
requests.put()与files参数一起使用会发送多部分/表单数据编码的请求,即使声明了正确的内容类型,服务器似乎也无法在不破坏数据的情况下处理该请求。
该curl命令只是使用包含在请求正文中的原始数据执行 PUT。您可以通过在data参数中传递文件数据来创建类似的请求。在标题中指定内容类型:
headers = {'Content-type': 'image/jpeg', 'Slug': fileName}
r = requests.put(url, data=open(path, 'rb'), headers=headers, auth=('username', 'pass'))
Run Code Online (Sandbox Code Playgroud)
您可以根据需要更改Content-type标头以适应有效负载。
尝试Content-type为文件设置。
如果您确定它是一个文本文件,那么请尝试text/plain在您的curl命令中使用哪个- 即使您似乎正在上传 jpeg 文件?但是,对于 jpeg 图像,您应该使用image/jpeg.
否则,对于任意二进制数据,您可以使用application/octet-stream:
openBin = {'file': (fileName, open(path,'rb'), 'image/jpeg' )}
Run Code Online (Sandbox Code Playgroud)
此外,没有必要在您的代码中显式读取文件内容,requests会为您执行此操作,因此只需传递打开的文件句柄,如上所示。