是否有比 pd.to_datetime 更快的日期转换?

koz*_*owh 4 python date date-conversion

我正在尝试将 pandas 数据框中格式为 01/01/2017 的日期转换为 python 格式,以便提取星期几。\n我一直在使用:

\n\n
df['Date'] = pd.to_datetime(df['Date'])\ndf['DOW'] = df['Date'].dt.weekday_name\n
Run Code Online (Sandbox Code Playgroud)\n\n

但第一行大约需要 250 \xc2\xb5s 并且我有超过 100 万个日期要转换。

\n\n

有没有更快的方法来做到这一点?

\n

Col*_*lin 5

由于您知道格式是什么,因此添加format参数将使速度加快约 40 倍。pd.to_datetime

pd.to_datetime(df['Date'], format='%d/%m/%Y')
Run Code Online (Sandbox Code Playgroud)

对我来说大约需要4秒

另外,这有点hacky,但如果您知道可能日期的上限和下限,您可以将数据与所有可能字符串的映射连接起来:

dates = pd.date_range(pd.Timestamp.min, pd.Timestamp.max)
date_mappings = pd.Series(dates, index=dates.strftime('%d/%m/%Y'), name='Date')
df = df.join(date_mappings, on='Date', lsuffix='_str')
Run Code Online (Sandbox Code Playgroud)

这在我的计算机上花费了不到 1 秒,如果您知道可能日期的范围,可能会进一步减少