将我自己的描述属性添加到Pandas DataFrame中

ely*_*ely 7 python metadata dataframe pandas

我正在检索一些Web数据,解析它,并将输出作为Pandas DataFrame存储到HDF5文件中.在我写入DataFrameH5文件之前,我添加了自己的描述字符串来注释一些关于数据来自何处以及解析时是否出错的元数据.

In [1]: my_data_frame.desc = "Some string about the data"

In [2]: my_data_frame.desc

Out[1]: "Some string about the data"

In [3]: print type(my_data_frame)
<class 'pandas.core.frame.DataFrame'>
Run Code Online (Sandbox Code Playgroud)

但是,加载相同的数据后pandas.io.pytables.HDFStore(),我添加的desc属性丢失,我得到错误:AttributeError: 'DataFrame' object has no attribute 'desc'好像我从未添加过这个新属性.

如何将我的元数据描述作为DataFrame对象的额外属性保留?(或者是否存在一些我可以为我的元数据目的而劫持的DataFrame现有的,已识别的属性?)

Wes*_*ney 5

添加 DataFrame 元数据或每列元数据已在路线图上,但尚未实施。不过,我对 API 应该是什么样子的想法持开放态度。