绘制大熊猫timedelta

Dat*_*ede 35 python matplotlib pandas

我有一个pandas数据框,它有两个datetime64列和一个timedelta64列,它们是两列之间的差异.我正在尝试绘制timedelta列的直方图,以显示两个事件之间的时间差异.

但是,只需使用df['time_delta']结果: TypeError: ufunc add cannot use operands with types dtype('<m8[ns]') and dtype('float64')

尝试将timedelta列转换为:float--> df2 = df1['time_delta'].astype(float) 结果: TypeError: cannot astype a timedelta from [timedelta64[ns]] to [float64]

如何创建pandas timedelta数据的直方图?

Jef*_*eff 43

以下是转换timedeltas的方法,docs在这里

In [2]: pd.to_timedelta(np.arange(5),unit='d')+pd.to_timedelta(1,unit='s')
Out[2]: 
0   0 days, 00:00:01
1   1 days, 00:00:01
2   2 days, 00:00:01
3   3 days, 00:00:01
4   4 days, 00:00:01
dtype: timedelta64[ns]
Run Code Online (Sandbox Code Playgroud)

转换为秒(是精确转换)

In [3]: (pd.to_timedelta(np.arange(5),unit='d')+pd.to_timedelta(1,unit='s')).astype('timedelta64[s]')
Out[3]: 
0         1
1     86401
2    172801
3    259201
4    345601
dtype: float64
Run Code Online (Sandbox Code Playgroud)

使用astype转换将舍入到该单位

In [4]: (pd.to_timedelta(np.arange(5),unit='d')+pd.to_timedelta(1,unit='s')).astype('timedelta64[D]')
Out[4]: 
0    0
1    1
2    2
3    3
4    4
dtype: float64
Run Code Online (Sandbox Code Playgroud)

分部将给出一个准确的repr

In [5]: (pd.to_timedelta(np.arange(5),unit='d')+pd.to_timedelta(1,unit='s')) / np.timedelta64(1,'D')
Out[5]: 
0    0.000012
1    1.000012
2    2.000012
3    3.000012
4    4.000012
dtype: float64
Run Code Online (Sandbox Code Playgroud)

  • 嗯...所以这些是转换timedeltas的一些方法......但问题是要求绘制timedelta信息的方法.注意详细说明? (5认同)

Ale*_*exG 8

您可以使用numpy timedelta数据类型绘制漂亮的直方图。

例如:

df['time_delta'].astype('timedelta64[s]').plot.hist()
Run Code Online (Sandbox Code Playgroud)

将以秒为单位生成时间增量的直方图。要使用分钟,您可以执行以下操作:

(df['time_delta'].astype('timedelta64[s]') / 60).plot.hist()
Run Code Online (Sandbox Code Playgroud)

或使用[m]timedelta。

df['time_delta'].astype('timedelta64[m]').plot.hist()
Run Code Online (Sandbox Code Playgroud)

根据所需的分辨率,以下是您可能需要的其他时间增量类型(来自docs)的列表:

Code    Meaning Time span (relative)    Time span (absolute)
h   hour    +/- 1.0e15 years    [1.0e15 BC, 1.0e15 AD]
m   minute  +/- 1.7e13 years    [1.7e13 BC, 1.7e13 AD]
s   second  +/- 2.9e11 years    [2.9e11 BC, 2.9e11 AD]
ms  millisecond +/- 2.9e8 years [ 2.9e8 BC, 2.9e8 AD]
us  microsecond +/- 2.9e5 years [290301 BC, 294241 AD]
ns  nanosecond  +/- 292 years   [ 1678 AD, 2262 AD]
ps  picosecond  +/- 106 days    [ 1969 AD, 1970 AD]
fs  femtosecond +/- 2.6 hours   [ 1969 AD, 1970 AD]
as  attosecond  +/- 9.2 seconds [ 1969 AD, 1970 AD]
Run Code Online (Sandbox Code Playgroud)


小智 8

怎么样

df['time_delta'].dt.days.hist()
Run Code Online (Sandbox Code Playgroud)

……?(您可以在哪里使用secondsmicroseconds、 或nanoseconds而不是days取决于您的需要/您的数据)。


ede*_*ans 5

另一种方法(对我有用)是简单地除以 a Timedelta

plt.hist(df['time_delta']/pd.Timedelta(minutes=1), bins=20)
Run Code Online (Sandbox Code Playgroud)