her*_*lla 21 python indexing time-series dataframe pandas
我有一个正常的df.index,我想补充几个小时.
In [1]: test[1].index
Out[2]:
<class 'pandas.tseries.index.DatetimeIndex'>
[2010-03-11, ..., 2014-08-14]
Length: 52, Freq: None, Timezone: None
Run Code Online (Sandbox Code Playgroud)
这是第一个元素的样子:
In [1]: test[1].index[0]
Out[2]: Timestamp('2010-03-11 00:00:00')
Run Code Online (Sandbox Code Playgroud)
所以我试着添加小时:
In [1]: test[1].index[0] + pd.tseries.timedeltas.to_timedelta(16, unit='h')
Run Code Online (Sandbox Code Playgroud)
但是我得到了这个:
Out[2]: Timestamp('2010-03-11 00:00:00.000000016')
Run Code Online (Sandbox Code Playgroud)
但我想得到这个:
Out[2]: Timestamp('2010-03-11 16:00:00')
Run Code Online (Sandbox Code Playgroud)
我错过了什么?环境是Anaconda(最新)Python 2.7.7,iPython 2.2
非常感谢
unu*_*tbu 31
您可以使用pd.DateOffset:
test[1].index + pd.DateOffset(hours=16)
Run Code Online (Sandbox Code Playgroud)
pd.DateOffset接受与dateutil.relativedelta相同的关键字参数.
您遇到的问题是由于此错误已在Pandas版本0.14.1中修复:
In [242]: pd.to_timedelta(16, unit='h')
Out[242]: numpy.timedelta64(16,'ns')
Run Code Online (Sandbox Code Playgroud)
如果升级,原始代码应该有效.