我正在尝试使用 pandas、hdf5 构建 ETL 工具包。
我的计划是
但是当我执行步骤 2 时,我发现将数据帧放入 *.h5 文件会花费太多时间。
我的问题是:
这个时间成本正常吗?
有什么办法可以让它更快吗?
谢谢杰夫
我的代码非常简单:
extract_store = HDFStore('extract_store.h5')
extract_store['df_staff'] = df_staff
Tables.Exceptions.HDF5ExtError:HDF5 错误回溯
文件“../../../src/H5F.c”,第 1512 行,在 H5Fopen 中
无法打开文件 文件“../../../src/H5F.c”,第 1307 行,在 H5F_open 中
无法读取超级块文件“../../../src/H5Fsuper.c”,第 305 行,在 H5F_super_read 中
无法找到文件签名文件“../../../src/H5Fsuper.c”,第153行,在H5F_locate_signature中
找不到有效的文件签名HDF5 错误回溯结束
无法打开/创建文件“extract_store.h5”
我在Mac OS上使用JetBrains Gogland 1.0 EAP,一切运行良好,但调试(基于钻孔)会引发错误
could not launch process: could not fork/exec
Run Code Online (Sandbox Code Playgroud)
我该如何解决?