我有一个包含以下列的pandas数据帧;
Date Time
01-06-2013 23:00:00
02-06-2013 01:00:00
02-06-2013 21:00:00
02-06-2013 22:00:00
02-06-2013 23:00:00
03-06-2013 01:00:00
03-06-2013 21:00:00
03-06-2013 22:00:00
03-06-2013 23:00:00
04-06-2013 01:00:00
Run Code Online (Sandbox Code Playgroud)
如何组合数据['日期']和数据['时间']以获得以下内容?有没有办法使用它pd.to_datetime?
Date
01-06-2013 23:00:00
02-06-2013 01:00:00
02-06-2013 21:00:00
02-06-2013 22:00:00
02-06-2013 23:00:00
03-06-2013 01:00:00
03-06-2013 21:00:00
03-06-2013 22:00:00
03-06-2013 23:00:00
04-06-2013 01:00:00
Run Code Online (Sandbox Code Playgroud) 我使用的是Python 2.7,panda 0.14.1-2,numpy 1.8.1-1.我必须使用Python 2.7,因为我将它与在Python 3上不起作用的东西耦合在一起
我正在尝试分析在单独的列中输出Month,Day和Hour的csv文件,看起来如下所示:
Month Day Hour Value
1 1 1 105
1 1 2 30
1 1 3 85
1 1 4 52
1 1 5 65
我基本上想要从这些列创建时间戳,并使用"2005"作为年份,并将此新时间戳列设置为索引.我已经阅读了很多类似的问题(这里和这里),但它们都依赖于read_csv().我没有年份专栏,所以我认为这不适用于我(除了加载数据框,插入列,写入和重做read_csv ...似乎是错综复杂的).
加载数据帧后,我在位置0插入一个Year列df.insert(0,"Year",2005)
所以现在我有了
Year Month Day Hour Value
2005 1 1 1 105
2005 1 1 2 30
2005 1 1 3 85
2005 1 1 4 52
2005 1 1 5 65
df.types告诉我所有列都是int64类型.
然后我尝试这样做:
df['Datetime'] = pd.to_datetime(df.Year*1000000 + df.Month*10000 + df.Day+100 + df.Hour, …