pandas:从时间戳中提取日期和时间

chi*_*n s 6 python time-series python-2.7 pandas

我有一个timestamp列,其中时间戳采用以下格式

2016-06-16T21:35:17.098+01:00
Run Code Online (Sandbox Code Playgroud)

我想从中提取日期和时间.我做了以下事情:

import datetime as dt

df['timestamp'] = df['timestamp'].apply(lambda x : pd.to_datetime(str(x)))

df['dates'] = df['timestamp'].dt.date
Run Code Online (Sandbox Code Playgroud)

这工作了一段时间.但突然之间却没有.

如果我再次这样做,df['dates'] = df['timestamp'].dt.date我会收到以下错误

Can only use .dt accessor with datetimelike values
Run Code Online (Sandbox Code Playgroud)

幸运的是,我已经dates在csv中保存了数据框,但我现在想要以time格式创建另一列23:00:00.051

编辑

从原始数据文件(1500万个样本)中,该timestamp列看起来如下(前5个样本):

            timestamp

0           2016-06-13T00:00:00.051+01:00
1           2016-06-13T00:00:00.718+01:00
2           2016-06-13T00:00:00.985+01:00
3           2016-06-13T00:00:02.431+01:00
4           2016-06-13T00:00:02.737+01:00
Run Code Online (Sandbox Code Playgroud)

执行以下命令后

df['timestamp'] = df['timestamp'].apply(lambda x : pd.to_datetime(str(x)))
Run Code Online (Sandbox Code Playgroud)

timestamp列与dtypedtype 类似:datetime64 [ns]

0    2016-06-12 23:00:00.051
1    2016-06-12 23:00:00.718
2    2016-06-12 23:00:00.985
3    2016-06-12 23:00:02.431
4    2016-06-12 23:00:02.737
Run Code Online (Sandbox Code Playgroud)

然后最后

df['dates'] = df['timestamp'].dt.date

0           2016-06-12
1           2016-06-12
2           2016-06-12
3           2016-06-12
4           2016-06-12
Run Code Online (Sandbox Code Playgroud)

编辑2

发现了错误.我已经清理了数据并将数据框保存在csv文件中,因此我不必再次进行清理.当我读取csv时,时间戳会dtype更改为object.现在我该如何解决这个问题?

Gur*_*cor 30

先这样做:

df['time'] = pd.to_datetime(df['timestamp'])
Run Code Online (Sandbox Code Playgroud)

在像往常一样进行提取之前:

df['dates'] = df['time'].dt.date
Run Code Online (Sandbox Code Playgroud)


小智 11

导入日期时间

如果date是字符串形式的话

import datetime

# this line converts the string object in Timestamp object
df['DateTime'] = [datetime.datetime.strptime(d, "%Y-%m-%d %H:%M") for d in df["DateTime"]]

# extracting date from timestamp
df['Date'] = [datetime.datetime.date(d) for d in df['DateTime']] 

# extracting time from timestamp
df['Time'] = [datetime.datetime.time(d) for d in df['DateTime']] 
Run Code Online (Sandbox Code Playgroud)

如果对象已经是时间戳格式而不是跳过第一行代码.

"%Y-%m-%d%H:%M"这表示您的时间戳对象必须采用"2016-05-16 12:35:00"之类的形式.