我有一个大型数据集,其中包含超过500 000个日期和时间戳,如下所示:
date time
2017-06-25 00:31:53.993
2017-06-25 00:32:31.224
2017-06-25 00:33:11.223
2017-06-25 00:33:53.876
2017-06-25 00:34:31.219
2017-06-25 00:35:12.634
Run Code Online (Sandbox Code Playgroud)
如何将这些时间戳取整到最接近的秒数?
我的代码如下所示:
readcsv = pd.read_csv(filename)
log_date = readcsv.date
log_time = readcsv.time
readcsv['date'] = pd.to_datetime(readcsv['date']).dt.date
readcsv['time'] = pd.to_datetime(readcsv['time']).dt.time
timestamp = [datetime.datetime.combine(log_date[i],log_time[i]) for i in range(len(log_date))]
Run Code Online (Sandbox Code Playgroud)
所以现在我将日期和时间组合成一个datetime.datetime看起来像这样的对象列表:
datetime.datetime(2017,6,25,00,31,53,993000)
datetime.datetime(2017,6,25,00,32,31,224000)
datetime.datetime(2017,6,25,00,33,11,223000)
datetime.datetime(2017,6,25,00,33,53,876000)
datetime.datetime(2017,6,25,00,34,31,219000)
datetime.datetime(2017,6,25,00,35,12,634000)
Run Code Online (Sandbox Code Playgroud)
我从这里去哪里?该df.timestamp.dt.round('1s')功能似乎不起作用?另外在使用时,.split()我遇到了问题,即秒和分钟超过59
非常感谢