我正在努力将一个小程序从C转换为Python,我在阅读文件时遇到了麻烦.它是一个.dat文件,数据为十六进制格式.这是我正在尝试阅读的前132个字节
2400 0000 4c61 7a61 726f 2053 756e 6965
7200 ffff 0000 0000 7261 6a70 6f6f 7420
6279 776f 726b 2069 7363 6869 6f70 7562
6963 2073 6872 6f76 6574 6964 6520 6469
7373 7561 5275 746c 616e 642c 5665 726d
6f6e 742c 0d00 0000 7000 0000 0000 0000
0000 0000 0000 0000 4000 0000 0000 0000
ffff ffff 656e 2073 6f76 6572 6f62 6564
6965 6e74
Run Code Online (Sandbox Code Playgroud)
fp读取它的C代码打开文件并像这样读取它.
TEXT_SHORT = 64;
fread(&(record->id), sizeof(int), 1, fp);
fread(&(record->name[0]), sizeof(char), TEXT_SHORT, fp);
fread(&(record->location[0]), sizeof(char), TEXT_SHORT, fp);
printf("%06d\n", record->id);
printf("%s\n", record->name);
printf("%s\n", record->location);
Run Code Online (Sandbox Code Playgroud)
然后在打印值时,我得到这个:
36
Lazaro Sunier
Rutland,Vermont,
Run Code Online (Sandbox Code Playgroud)
要将此功能转换为Python,我编写了以下代码:
def read_file(file):
id = struct.unpack('i', file.read(4))[0]
name = ''.join(struct.unpack('c'*64, file.read(64)))
location = ''.join(struct.unpack('c'*64, file.read(64)))
print(id)
print(name)
print(location)
Run Code Online (Sandbox Code Playgroud)
然后我得到这个输出
36
Lazaro Sunier??rajpoot bywork ischiopubic shrovetide dissua
p@????en soverobedient
Run Code Online (Sandbox Code Playgroud)
我一直在努力解决这个问题,并且不知道为什么会这样.有没有fread()做的事情是我需要在Python中实现的背景,还是我做错了?
虽然你在C和Python中读取64字节块,但Python没有\x00字符串终止符.因此,虽然printf在C中将打印到第一个\0,但Python将打印整个缓冲区,包括尾随垃圾.
只需将字符串拆分为\0仅保留第一部分:
name = name.split(b"\0", 1)[0]
location = name.split(b"\0", 1)[0]
Run Code Online (Sandbox Code Playgroud)
顺便说一句,您可以在一行中检索3个元素:
id, name, location = struct.unpack("i64s64s", file.read(132))
name = name.split(b"\0", 1)[0]
location = name.split(b"\0", 1)[0]
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
471 次 |
| 最近记录: |