我有一个数据超过300万条记录,其中start.time和end.time是两个变量.前10个障碍如下:
start.date start.time end.date end.time
1 2012-07-13 15:01:32 2012-07-13 15:02:42
2 2012-07-05 18:26:31 2012-07-05 18:27:19
3 2012-07-14 20:23:21 2012-07-14 20:24:11
4 2012-07-29 16:09:54 2012-07-29 16:10:48
5 2012-07-21 14:58:32 2012-07-21 15:00:17
6 2012-07-04 15:36:31 2012-07-04 15:37:11
7 2012-07-22 18:28:31 2012-07-22 18:28:50
8 2012-07-09 21:08:42 2012-07-09 21:09:02
9 2012-07-05 09:44:52 2012-07-05 09:45:05
10 2012-07-02 18:50:47 2012-07-02 18:51:38
Run Code Online (Sandbox Code Playgroud)
我需要计算start.time和end.time之间的差异.
我使用了以下代码:
mbehave11$diff.time <- difftime(mbehave11$end.time, mbehave11$start.time, units="secs")
Run Code Online (Sandbox Code Playgroud)
但是我收到了这个错误:
Error in as.POSIXlt.character(x, tz, ...) :
character string is not in a standard unambiguous format
In addition: …Run Code Online (Sandbox Code Playgroud) 我有一个长格式的联合调查数据.前几行看起来像这样:
ID alt choice size tar length brand flavor gender age yr_smoke num_smoke job
1 1 1 no 1 1 1 1 1 2 35 10 20 1
2 1 2 no 1 1 1 1 1 2 35 10 20 1
3 1 3 no 1 1 1 1 1 2 35 10 20 1
4 1 4 no 1 1 1 1 1 2 35 10 20 1
5 1 5 no 1 1 1 1 1 2 …Run Code Online (Sandbox Code Playgroud) 我kcca用来拟合k中值聚类.我使用了以下语法:
kcca.out1_1 <- kcca(clusterdata1_1, k=5, family=kccaFamily("kmedians"), save.data=TRUE)
Run Code Online (Sandbox Code Playgroud)
现在我希望将集群成员资格作为数据框架或向量,以便我可以在我的数据集中使用它们来进行进一步的数据分析.
任何形式的帮助将受到高度赞赏.