Python创建的HDF5数据集在Matlab中转置

Joh*_*nak 8 python matlab numpy hdf5 h5py

我有一些我在Python和Matlab之间共享的数据.我曾经通过在MATLAB风格的.mat文件中保存NumPy数组来做到这一点,但是想切换到HDF5数据集.但是,我注意到一个有趣的特性:当我将NumPy数组保存在HDF5文件中(使用h5py)然后在Matlab中读取它(使用h5read)时,它最终会被转置.有什么我想念的吗?

Python代码:

import numpy as np
import h5py

mystuff = np.random.rand(10,30)

f = h5py.File('/home/user/test.h5', 'w')
f['mydataset'] = mystuff
f.close()
Run Code Online (Sandbox Code Playgroud)

Matlab代码:

mystuff = h5read('/home/user/test.h5', '/mydataset');
size(mystuff) % 30 by 10
Run Code Online (Sandbox Code Playgroud)

Hig*_*ark 7

请参阅Matlab HDF5文档,其中包括以下声明:

因为HDF5以行主要顺序存储数据,而MATLAB数组按列主要顺序组织,所以应该反转维度范围的顺序...

即便在今天,在Mathworks将代码转换为C()之后很久,产品的Fortran起源时不时地突破表面.


pv.*_*pv. 7

这是Matlab的HDF5阅读器例程中的一个怪癖.(我认为这种行为背后的原因是:数据在二进制文件中是C顺序,而Matlab数组是以Fortran顺序排列的,所以他们应该将数据报告为转置而不是重新排序.)

如果您使用HDF5工具检查Python创建的文件,那么尺寸应该是它们应该是:

$ h5ls test.h5 
mydataset                Dataset {10, 30}