在Python中读取和解释二进制文件中的数据

Question

在Python中读取和解释二进制文件中的数据

dub*_*uga 23 python binary bitwise-operators

我想逐字节读取文件并检查每个字节的最后一位是否设置:

#!/usr/bin/python

def main():
    fh = open('/tmp/test.txt', 'rb')
    try:
        byte = fh.read(1)
        while byte != "":
            if (int(byte,16) & 0x01) is 0x01:
                print 1
            else:
                print 0
            byte = fh.read(1)
    finally:
        fh.close

    fh.close()

if __name__ == "__main__":
        main()

Run Code Online (Sandbox Code Playgroud)

我得到的错误是:

Traceback (most recent call last):
  File "./mini_01.py", line 21, in <module>
    main()
  File "./mini_01.py", line 10, in main
    if (int(byte,16) & 0x01) is 0x01:
ValueError: invalid literal for int() with base 16: '\xaf'

Run Code Online (Sandbox Code Playgroud)

有人有想法吗？我没有成功使用struct和binascii模块.

Answer 1

Sco*_*ths 40

尝试使用bytearray类型(Python 2.6及更高版本),它更适合处理字节数据.你的try块只是:

ba = bytearray(fh.read())
for byte in ba:
    print byte & 1

Run Code Online (Sandbox Code Playgroud)

或者创建结果列表:

low_bit_list = [byte & 1 for byte in bytearray(fh.read())]

Run Code Online (Sandbox Code Playgroud)

这是有效的,因为当你索引一个bytearray你只是得到一个整数(0-255),而如果你只是从文件中读取一个字节,你得到一个字符串,所以需要用ord它来转换为整数.

如果你的文件太大而不能舒服地保存在内存中(虽然我猜它不是),那么mmap可以用一个来创建bytearray缓冲区:

import mmap
m = mmap.mmap(fh.fileno(), 0, access=mmap.ACCESS_READ)
ba = bytearray(m)

Run Code Online (Sandbox Code Playgroud)

大文件解决方案的+1,我从很多头发撕裂中得救了.你先生是绅士和学者. (2认同)

Answer 2

nmi*_*els 8

你想用ord而不是int:

if (ord(byte) & 0x01) == 0x01:

Run Code Online (Sandbox Code Playgroud)

你真的应该将整数与`=='进行比较,而不是用他们的身份进行比较! (5认同)

Answer 3

tzo*_*zot 5

单程：

import array

filebytes= array.array('B')
filebytes.fromfile(open("/tmp/test.txt", "rb"))
if all(i & 1 for i in filebytes):
    # all file bytes are odd

Run Code Online (Sandbox Code Playgroud)

其他方式：

fobj= open("/tmp/test.txt", "rb")

try:
    import functools
except ImportError:
    bytereader= lambda: fobj.read(1)
else:
    bytereader= functools.partial(fobj.read, 1)

if all(ord(byte) & 1 for byte in iter(bytereader, '')):
    # all bytes are odd
fobj.close()

Run Code Online (Sandbox Code Playgroud)

归档时间：	15 年，3 月前
查看次数：	58781 次
最近记录：	8 年，3 月前