我使用以下R代码生成带有基于TraMineR序列的标签的树形图(参见附图):
library(TraMineR)
library(cluster)
clusterward <- agnes(twitter.om, diss = TRUE, method = "ward")
plot(clusterward, which.plots = 2, labels=colnames(twitter_sequences))
Run Code Online (Sandbox Code Playgroud)
完整代码(包括数据集)可以在这里找到.
由于树形图以图形方式提供信息,因此以文本和/或表格格式获取相同信息将非常方便.如果我调用对象clusterward的任何方面(由agnes创建),例如"order"或"merge",我会使用数字而不是我得到的名称来标记所有内容colnames(twitter_sequences).另外,我看不出如何输出树形图中以图形方式表示的分组.
总结一下:如何使用R以及理想情况下的电车/集群库正确显示标签,以文本/表格格式获取集群输出?

我正在尝试使用R中的TraMineR使用时间日记数据(美国时间使用调查)进行序列分析.我将数据作为SPELL数据(id,开始时间,停止时间,事件)但是在尝试时我收到以下错误将其转换为STS或SPS数据:
as.matrix.data.frame中的错误(subset(data,,2)):dims [product 0]与object [9]的长度不匹配
我认为这与我如何将时间(作为角色)转换为日期/时间类型有关.我相信TraMineR需要一个POSIXlt格式?
这是我原始数据的片段(trcode是事件)
头(atus.act.short)
tucaseid tustarttim tustoptime trcode
1 2.00701e+13 04:00:00 08:00:00 10101
2 2.00701e+13 08:00:00 08:20:00 110101
3 2.00701e+13 08:20:00 08:50:00 10201
4 2.00701e+13 08:50:00 09:30:00 20102
5 2.00701e+13 09:30:00 09:40:00 180201
6 2.00701e+13 09:40:00 11:40:00 20102
Run Code Online (Sandbox Code Playgroud)
我使用strptime将字符串转换为POSIXlt:
atus.act.short$starttime.new <- strptime(atus.act.short$tustarttim, format="%X")
atus.act.short$stoptime.new <- strptime(atus.act.short$tustoptime, format="%X")
Run Code Online (Sandbox Code Playgroud)
我还将ID减少到只有两位数
atus.act.short$id <- atus.act.short$tucaseid-20070101070000
Run Code Online (Sandbox Code Playgroud)
我最终得到一个新的数据框如下:
id starttime.new stoptime.new trcode
1 44 2012-08-03 04:00:00 2012-08-03 08:00:00 10101
2 44 2012-08-03 08:00:00 2012-08-03 08:20:00 110101
3 44 2012-08-03 08:20:00 2012-08-03 08:50:00 …Run Code Online (Sandbox Code Playgroud) news()R函数的帮助页面说:
它试图从文件'inst/NEWS.Rd','NEWS'或'inst/NEWS'(按此顺序)以结构化形式阅读其新闻.
这样做并安装包,我们得到(在Windows下)命令打开的html页面顶部的NEWS文件的链接 help(package=packagename).例如,假设您已安装party,您可以尝试
help(package="party")
Run Code Online (Sandbox Code Playgroud)
但这仅适用于名为NEWS的文件.当我们提供NEWS.Rd文件时,没有新闻链接.尝试
help(package="survival")
Run Code Online (Sandbox Code Playgroud)
当我们提供NEWS.Rd文件时,有没有办法获得此链接?
谢谢你的帮助.
我正在使用TraMineR包.我打印输出到CSV文件,如下所示:
write.csv(seqient(sequences.seq), file = "diversity_measures.csv", quote = FALSE, na = "", row.names = TRUE)
write.csv(seqici(sequences.seq), file = "diversity_measures.csv", quote = FALSE, na = "", row.names = TRUE, append= TRUE)
write.csv(seqST(sequences.seq), file = "diversity_measures.csv", quote = FALSE, na = "", row.names = TRUE, append= TRUE)
Run Code Online (Sandbox Code Playgroud)
可以在此处找到dput(sequences.seq)对象.
但是,这不会正确附加输出,但会创建此错误消息:
In write.csv(seqST(sequences.seq), file = "diversity_measures.csv", :attempt to set 'append' ignored
Run Code Online (Sandbox Code Playgroud)
另外,它只给我最后一个命令的输出,所以看起来它每次都会覆盖文件.
是否可以将所有列都放在一个CSV文件中,每个列都有一个列名(即熵,复杂性,湍流)