我试图在为我的数据选择顶级Cox比例风险模型时,使用类似于(如果不是实际的话)在程序R的跳跃包中的regsubsets的函数.这可能吗?如果是这样,功能是否已经存在?
我有一个类似于此的data.frame
id <- c(1,1,1,2,2,3,3,3,3,3)
action <- c("for","l","for","f","l","l","for","for","for","f")
time <- c(45,35,24,56,100,121,30,10,35,143)
dframe <- data.frame(id,action,time)
Run Code Online (Sandbox Code Playgroud)
只有动作"for"在每个唯一id中的连续行中重复.我想将这些行折叠成一行,将行动时间总计为"for".我想只在每个唯一ID内和它们彼此跟随时这样做(如id == 3,而不是id == 1)
我尝试了下面的代码,但是这并没有区分一个接一个跟随的动作,而是将唯一id中所有出现的"for"相加.
aggregate(action_time ~ id + act, data=mean.event, FUN=sum)
Run Code Online (Sandbox Code Playgroud)
谢谢你的时间.
我在程序R中使用mlogit包.我已将我的数据从其原始宽格式转换为长格式.这是转换后的data.frame的示例,我将其称为"long_perp".所有自变量都是个体特定的.我在数据集中有4258个独特的观察结果.
date_id act2 grp.bin pdist ship sea avgknots shore day location chid alt
4.dive 40707_004 TRUE 2 2.250 second light 14.06809 2.30805 12 Lower 4 dive
4.fly 40707_004 FALSE 2 2.250 second light 14.06809 2.30805 12 Lower 4 fly
4.none 40707_004 FALSE 2 2.250 second light 14.06809 2.30805 12 Lower 4 none
5.dive 40707_006 FALSE 2 0.000 second light 15.12650 2.53312 12 Lower 5 dive
5.fly 40707_006 TRUE 2 0.000 second light 15.12650 2.53312 12 Lower 5 fly
5.none 40707_006 …Run Code Online (Sandbox Code Playgroud) 我收集了有关船舶海鸟干扰的数据。我在船上带着测距双筒望远镜和角度板。对于我调查的每只鸟,我都有一个相对于船舶航向的起始距离和方位。我还有鸟做出反应(或在某些情况下没有反应)的距离和方位。
我想制作一个两面板图,其中一个显示起始距离和轴承位置,另一个显示终止距离和轴承。理想情况下,第二个图将进行颜色编码(或 pch 编码)以显示不同的反应类型。
我的数据是这种格式
date_id dist bear act
550 40711_027 200 30 f
551 40711_028 500 45 n
552 40711_028 450 60 n
553 40711_028 400 75 n
554 40711_028 371 80 f
555 40711_029 200 5 f
556 40711_030 200 10 d
557 40711_031 400 30 n
558 40711_031 350 30 d
Run Code Online (Sandbox Code Playgroud)
这是您可以使用的格式的数据
id <- c(1,2,2,2,2,3,4,5,5)
dist <- c(200,500,450,400,371,200,200,400,350)
bear <- c(30,45,60,75,80,5,10,30,30)
act <- c("f","n","n","n","f","f","d","n","d")
dat <- data.frame(id, dist, bear, act)
Run Code Online (Sandbox Code Playgroud)
正如您所看到的,有些 id 是重复的,有些则只有一行。我想在一个地块上绘制第一个距离和熊,在另一个地块上绘制最后一个距离和熊(每个 ID)。对于只有一次观察的鸟类来说,这些可能是相同的。最好根据“act”列对第二个图中的点进行颜色编码。此外,方位没有左侧或右侧的指定,所以我可以接受所有点都位于中线的一侧或另一侧,但如果您知道将它们随机放置在中心线的左侧或右侧会很酷。理想情况下,绘图看起来像这样。

更新:遵循@jbaums 的建议,使用他在此处 …
我创建了一个零膨胀负二项式模型,想研究将多少个零分配给采样或结构零。我如何在R中实现这一点。zeroinfl页面上的示例代码对我来说还不清楚。
data("bioChemists", package = "pscl")
fm_zinb2 <- zeroinfl(art ~ . | ., data = bioChemists, dist = "negbin")
table(round(predict(fm_zinb2, type="zero")))
> 0 1
> 891 24
table(round(bioChemists$art))
> 0 1 2 3 4 5 6 7 8 9 10 11 12 16 19
> 275 246 178 84 67 27 17 12 1 2 1 1 2 1 1
Run Code Online (Sandbox Code Playgroud)
这告诉我什么?
当我对数据执行相同操作时,我得到的读数只是样本量在1下列出?谢谢