我在保存到磁盘时尝试了各种方法进行数据压缩numpy arrays.
这些一维阵列包含一定采样率的采样数据(可以使用麦克风录制声音,或使用任何传感器进行任何其他测量):数据基本上是连续的(在数学意义上;当然,采样后它现在是离散数据) .
我试过HDF5(h5py):
f.create_dataset("myarray1", myarray, compression="gzip", compression_opts=9)
Run Code Online (Sandbox Code Playgroud)
但这很慢,压缩比不是我们所能期望的最好.
我也尝试过
numpy.savez_compressed()
Run Code Online (Sandbox Code Playgroud)
但是再一次,它可能不是这种数据的最佳压缩算法(如前所述).
对于numpy array这样的数据,你会选择什么来获得更好的压缩比?
(我考虑过无损FLAC(最初是为音频而设计),但是有一种简单的方法可以在numpy数据上应用这样的算法吗?)