bac*_*and 3 python hdf5 pandas
我试图得到存储在HDF5中的pandas数据帧的最后一行的索引,而不必将整个数据集或索引拉入内存.我正在寻找这样的东西:
from pandas import HDFStore
store = HDFStore('file.h5')
last_index = store.select('dataset', where='index == -1').index
Run Code Online (Sandbox Code Playgroud)
除了在我的情况下,最后一个索引不会是-1aTimestamp
使用start=与stop=位置索引器类似的和参数
In [8]: df = DataFrame({'A' : np.random.randn(10000)},index=pd.date_range('20130101',periods=10000,freq='s'))
In [9]: store = pd.HDFStore('test.h5',mode='w')
In [10]: store.append('df',df)
In [11]: nrows = store.get_storer('df').nrows
In [12]: nrows
Out[12]: 10000
In [13]: store.select('df',start=nrows-1,stop=nrows)
Out[13]:
A
2013-01-01 02:46:39 -0.890721
In [15]: df.iloc[[-1]]
Out[15]:
A
2013-01-01 02:46:39 -0.890721
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
1433 次 |
| 最近记录: |