我在熊猫数据框中有一个 int64 对象,它应该代表一个日期。
>>> df.dtypes
CreatedDate int64
Run Code Online (Sandbox Code Playgroud)
显然,我想将其转换为日期时间,因此我执行了以下操作
df["CreatedDate2"] = pd.to_datetime(pd.Series(df["CreatedDate"]))
>>> df[["CreatedDate","CreatedDate2"]].head()
CreatedDate CreatedDate2
0 1466461661000 1970-01-01 00:24:26.461661
1 1464210703000 1970-01-01 00:24:24.210703
2 1423576093000 1970-01-01 00:23:43.576093
3 1423611903000 1970-01-01 00:23:43.611903
4 1423617600000 1970-01-01 00:23:43.617600
>>>
Run Code Online (Sandbox Code Playgroud)
然而,这产生了 1970 年代的日期,这不应该是真的。谁能告诉我如何在 Pandas 数据框中将 int64 转换为日期时间。我认为这是正确的方法。
使用参数unitinto_datetime来转换 unix 纪元时间:
df["CreatedDate2"] = pd.to_datetime(df["CreatedDate"], unit='ms')
print (df)
CreatedDate CreatedDate2
0 1466461661000 2016-06-20 22:27:41
1 1464210703000 2016-05-25 21:11:43
2 1423576093000 2015-02-10 13:48:13
3 1423611903000 2015-02-10 23:45:03
4 1423617600000 2015-02-11 01:20:00
Run Code Online (Sandbox Code Playgroud)
您需要传递unit='ms'自 Unix Epoch 以来的毫秒数:
In[51]:
df['CreatedDate2'] = pd.to_datetime(df['CreatedDate'], unit='ms')
df
Out[51]:
CreatedDate CreatedDate2
0 1466461661000 2016-06-20 22:27:41
1 1464210703000 2016-05-25 21:11:43
2 1423576093000 2015-02-10 13:48:13
3 1423611903000 2015-02-10 23:45:03
4 1423617600000 2015-02-11 01:20:00
Run Code Online (Sandbox Code Playgroud)
默认情况下,如果传递的值为dtype ,则unitparam'ns'假定datetime64[ns]值为自 unix 纪元以来的纳秒数int64
| 归档时间: |
|
| 查看次数: |
8690 次 |
| 最近记录: |