dub*_*uga 23 python binary bitwise-operators
我想逐字节读取文件并检查每个字节的最后一位是否设置:
#!/usr/bin/python
def main():
fh = open('/tmp/test.txt', 'rb')
try:
byte = fh.read(1)
while byte != "":
if (int(byte,16) & 0x01) is 0x01:
print 1
else:
print 0
byte = fh.read(1)
finally:
fh.close
fh.close()
if __name__ == "__main__":
main()
Run Code Online (Sandbox Code Playgroud)
我得到的错误是:
Traceback (most recent call last):
File "./mini_01.py", line 21, in <module>
main()
File "./mini_01.py", line 10, in main
if (int(byte,16) & 0x01) is 0x01:
ValueError: invalid literal for int() with base 16: '\xaf'
Run Code Online (Sandbox Code Playgroud)
有人有想法吗?我没有成功使用struct和binascii模块.
Sco*_*ths 40
尝试使用bytearray类型(Python 2.6及更高版本),它更适合处理字节数据.你的try块只是:
ba = bytearray(fh.read())
for byte in ba:
print byte & 1
Run Code Online (Sandbox Code Playgroud)
或者创建结果列表:
low_bit_list = [byte & 1 for byte in bytearray(fh.read())]
Run Code Online (Sandbox Code Playgroud)
这是有效的,因为当你索引一个bytearray你只是得到一个整数(0-255),而如果你只是从文件中读取一个字节,你得到一个字符串,所以需要用ord它来转换为整数.
如果你的文件太大而不能舒服地保存在内存中(虽然我猜它不是),那么mmap可以用一个来创建bytearray缓冲区:
import mmap
m = mmap.mmap(fh.fileno(), 0, access=mmap.ACCESS_READ)
ba = bytearray(m)
Run Code Online (Sandbox Code Playgroud)
你想用ord而不是int:
if (ord(byte) & 0x01) == 0x01:
Run Code Online (Sandbox Code Playgroud)
单程:
import array
filebytes= array.array('B')
filebytes.fromfile(open("/tmp/test.txt", "rb"))
if all(i & 1 for i in filebytes):
# all file bytes are odd
Run Code Online (Sandbox Code Playgroud)
其他方式:
fobj= open("/tmp/test.txt", "rb")
try:
import functools
except ImportError:
bytereader= lambda: fobj.read(1)
else:
bytereader= functools.partial(fobj.read, 1)
if all(ord(byte) & 1 for byte in iter(bytereader, '')):
# all bytes are odd
fobj.close()
Run Code Online (Sandbox Code Playgroud)