我在数据框中有两列和迄今为止的列
当我尝试添加新的列差异时,找到两个日期之间的差异使用
df['diff'] = df['todate'] - df['fromdate']
Run Code Online (Sandbox Code Playgroud)
如果超过24小时,我会在几天内得到差异列.
2014-01-24 13:03:12.050000,2014-01-26 23:41:21.870000,"2 days, 10:38:09.820000"
2014-01-27 11:57:18.240000,2014-01-27 15:38:22.540000,03:41:04.300000
2014-01-23 10:07:47.660000,2014-01-23 18:50:41.420000,08:42:53.760000
Run Code Online (Sandbox Code Playgroud)
如何仅在小时和分钟内转换结果,忽略天数甚至秒数.
如何运行sklearn TFIDF vectorizer(和COUNT vectorizer)作为并行作业运行?与其他sklearn模型中的n_jobs = -1参数类似的东西.
如何在默认日期为 2015-01-01 的数据框中填写 NAN 值
我在这里用什么 df['SIGN_DATE'] = df['SIGN_DATE'].fillna(??, inplace=True)
>>>df.SIGN_DATE.head()
0 2012-03-28 14:14:18
1 2011-05-18 00:41:48
2 2011-06-13 16:36:58
3 nan
4 2011-05-22 23:43:56
Name: SIGN_DATE, dtype: object
type(df.SIGN_DATE)
pandas.core.series.Series
Run Code Online (Sandbox Code Playgroud)