使用python从二进制文件中读取数字数据

Jay*_*Tee 2 python binary file-io

我想读取一个包含标题部分(文本)和数字数组的二进制数据文件。我可以使用 f.read(block_size) 在标题部分保持流式传输,但是读取数字数组的最佳方法是什么?

在 MatLab 中,我可以做

fid = fopen(data_file_name, 'rb');
line = fread(fid, block_size, '*char'); 
data = fread(fid, 'long');
Run Code Online (Sandbox Code Playgroud)

在 Python 中,我所做的是

f = open(data_file_name, 'rb')
header = f.read(block_size)
Run Code Online (Sandbox Code Playgroud)

从这里我不知道如何进入数值数组。

mgi*_*son 5

您可以使用struct.unpack解包数字数据。

例如

with open('file','rb') as fin:
    header = fin.read(header_size)
    data_str = fin.read(num_data_bytes)
    data_tuple = struct.unpack('100f',data_str)  #100 4-byte floats
Run Code Online (Sandbox Code Playgroud)

根据数据,您可以使用numpy.fromfile. 该函数接受一个打开的文件对象,因此您可以读取标头,然后将打开的文件对象传递给 numpy 可以读取数据。在这个问题中,我询问了将二进制数据从字符串读取到 numpy 数组的细节。这是一个稍微不同的问题,但那里的大部分答案也适用于此(如何指定字节顺序等)