Python编写二进制文件,字节

Tur*_*ute 11 python io buffer bufferedreader python-3.x

Python 3.我正在使用QT的文件对话框小部件来保存从互联网下载的PDF.我一直在使用'open'读取文件,并尝试使用文件对话框小部件来编写它.但是,我一直遇到"TypeError:'_ io.BufferedReader'不支持缓冲区接口"错误.

示例代码:

with open('file_to_read.pdf', 'rb') as f1: 
    with open('file_to_save.pdf', 'wb') as f2:
        f2.write(f1)
Run Code Online (Sandbox Code Playgroud)

当不使用'b'指示符时,或者当从web读取文件时,这种逻辑适用于文本文件,例如urllib或者请求.这些是"字节"类型,我认为我需要打开文件.相反,它作为缓冲读者开放.我尝试了字节(f1),但得到"TypeError:'bytes'对象不能被解释为整数." 有什么想法吗?

daw*_*awg 14

如果您的目的是简单地制作文件的副本,则可以使用shutil

>>> import shutil
>>> shutil.copyfile('file_to_read.pdf','file_to_save.pdf')
Run Code Online (Sandbox Code Playgroud)

或者,如果您需要逐字节访问,类似于您的结构,这适用:

>>> with open('/tmp/fin.pdf','rb') as f1:
...    with open('/tmp/test.pdf','wb') as f2:
...       while True:
...          b=f1.read(1)
...          if b: 
...             # process b if this is your intent   
...             n=f2.write(b)
...          else: break
Run Code Online (Sandbox Code Playgroud)

但逐字节可能真的很慢.

或者,如果你想要一个能够加快速度的缓冲区(不承担将未知文件大小完全读入内存的风险):

>>> with open('/tmp/fin.pdf','rb') as f1:
...    with open('/tmp/test.pdf','wb') as f2:
...       while True:
...          buf=f1.read(1024)
...          if buf: 
...              for byte in buf:
...                 pass    # process the bytes if this is what you want
...                         # make sure your changes are in buf
...              n=f2.write(buf)
...          else:
...              break
Run Code Online (Sandbox Code Playgroud)

使用Python 2.7+或3.1+,您也可以使用此快捷方式(而不是使用两个with块):

with open('/tmp/fin.pdf','rb') as f1,open('/tmp/test.pdf','wb') as f2:
    ...
Run Code Online (Sandbox Code Playgroud)


Kri*_*itz 5

在另一个文件中写入文件真的没有意义.你想要的是在f2中写入f1的内容.你用f1.read()获得内容.所以你必须这样做:

with open('file_to_read.pdf', 'rb') as f1: 
    with open('file_to_save.pdf', 'wb') as f2:
        f2.write(f1.read())
Run Code Online (Sandbox Code Playgroud)

  • 虽然这样可行,但整个文件在写入之前会被读入内存 - 对内存不太友好.正如Python [docs](http://docs.python.org/2/tutorial/inputoutput.html#methods-of-file-objects)中所述,如果文件的大小是机器内存的两倍,那就是你的问题` (5认同)

Wei*_*gTu 5

学习了 python cookbook

from functools import partial

with open(fpath, 'rb') as f, open(target_fpath, 'wb') as target_f: 
    for _bytes in iter(partial(f.read, 1024), ''):
        target_f.write(_bytes)
Run Code Online (Sandbox Code Playgroud)

partial(f.read, 1024)返回一个函数,每次读取二进制文件1024字节。iter将在遇到 a 时结束blank string ''