我想问一个关于压缩性能的问题,这与hdf5文件的块大小有关.
我手边有2个hdf5文件,它们具有以下属性.它们都只包含一个数据集,称为"数据".
文件A的"数据":
文件B的"数据":
文件A的大小:HDF5 ---- 19 MB CSV ----- 165 MB
文件B的大小:HDF5 ---- 60 MB CSV ----- 165 MB
与csv文件相比,它们都显示了对存储数据的强大压缩.但是,文件A的压缩率约为原始csv的10%,而文件B的压缩率仅为原始csv的约30%.
我尝试了不同的块大小使文件B尽可能小,但似乎30%是最佳压缩率.我想问一下,为什么文件A可以实现更大的压缩,而文件B则不能.
如果文件B也可以实现,那么块大小应该是多少?
是否有任何规则来确定HDF5的最佳块大小以用于压缩目的?
谢谢!