使用pytables或pandas删除表或节点后释放hdf5磁盘内存

jru*_*ren 5 python hdf5 pytables pandas

我正在使用带有pandas/pytables的HDFStore.

删除表或对象后,hdf5文件大小不受影响.当将额外的对象添加到存储中时,似乎此空间会被重用,但如果浪费大的空间则可能会出现问题.

我没有在pandas或pytables API中找到任何可能用于恢复hdf5内存的命令.

您知道在hdf5文件中改进数据管理的任何机制吗?

Jef*_*eff 11

看到这里

你需要ptrepack它,它重写文件.

ptrepack --chunkshape=auto --propindexes --complevel=9 --complib=blosc in.h5 out.h5
Run Code Online (Sandbox Code Playgroud)

作为一个例子(这也将压缩文件).