struct.error:unpack需要长度为4的字符串参数

Tho*_*s O 21 python struct

Python说我需要4个字节的格式代码为"BH":

struct.error: unpack requires a string argument of length 4
Run Code Online (Sandbox Code Playgroud)

这是代码,我认为需要3个字节:

major, minor = struct.unpack("BH", self.fp.read(3))
Run Code Online (Sandbox Code Playgroud)

"B"无符号字符(1字节)+"H"无符号短(2字节)= 3字节(!?)

struct.calcsize("BH")表示4个字节.

编辑:文件大约800 MB,这是在文件的前几个字节,所以我很确定还有剩余的数据需要读取.

Mar*_*nen 22

struct模块模仿C结构.处理器读取奇数地址上的16位字或者不能被4整除的地址上的32位双字需要更多的CPU周期,因此结构添加"填充字节"以使结构成员落在自然边界上.考虑:

struct {                   11
    char a;      012345678901
    short b;     ------------
    char c;      axbbcxxxdddd
    int d;
};
Run Code Online (Sandbox Code Playgroud)

该结构将占用12个字节的存储器(x是填充字节).

Python的工作方式类似(请参阅struct文档):

>>> import struct
>>> struct.pack('BHBL',1,2,3,4)
'\x01\x00\x02\x00\x03\x00\x00\x00\x04\x00\x00\x00'
>>> struct.calcsize('BHBL')
12
Run Code Online (Sandbox Code Playgroud)

编译器通常有一种消除填充的方法.在Python中,任何= <>!将消除填充:

>>> struct.calcsize('=BHBL')
8
>>> struct.pack('=BHBL',1,2,3,4)
'\x01\x02\x00\x03\x04\x00\x00\x00'
Run Code Online (Sandbox Code Playgroud)

小心让struct处理填充.在C中,这些结构:

struct A {       struct B {
    short a;         int a;
    char b;          char b;
};               };
Run Code Online (Sandbox Code Playgroud)

通常分别为4和8个字节.在结构用于阵列的情况下,填充发生在结构的末端.这使得'a'成员在数组中稍后的结构的正确边界上保持对齐.Python的struct模块最后没有填充:

>>> struct.pack('LB',1,2)
'\x01\x00\x00\x00\x02'
>>> struct.pack('LBLB',1,2,3,4)
'\x01\x00\x00\x00\x02\x00\x00\x00\x03\x00\x00\x00\x04'
Run Code Online (Sandbox Code Playgroud)


int*_*jay 8

默认情况下,在许多平台上,short将与2的倍数对齐,因此在char之后会添加填充字节.

要禁用此功能,请使用:struct.unpack("=BH", data).这将使用标准对齐,不添加填充:

>>> struct.calcsize('=BH')
3
Run Code Online (Sandbox Code Playgroud)

=字符将使用本机字节排序.您也可以分别使用<>代替=强制little-endian或big-endian字节顺序.