小编mar*_*llt的帖子

我可以为R中的Cox比例风险模型执行所有子集变量选择吗？

我试图在为我的数据选择顶级Cox比例风险模型时,使用类似于(如果不是实际的话)在程序R的跳跃包中的regsubsets的函数.这可能吗？如果是这样,功能是否已经存在？

r cox-regression survival-analysis

mar*_*llt

2013 01-16

5
推荐指数

1
解决办法

2794
查看次数

根据条件求和相邻行

我有一个类似于此的data.frame

id <- c(1,1,1,2,2,3,3,3,3,3)
action <- c("for","l","for","f","l","l","for","for","for","f")
time <- c(45,35,24,56,100,121,30,10,35,143)
dframe <- data.frame(id,action,time)

Run Code Online (Sandbox Code Playgroud)

只有动作"for"在每个唯一id中的连续行中重复.我想将这些行折叠成一行,将行动时间总计为"for".我想只在每个唯一ID内和它们彼此跟随时这样做(如id == 3,而不是id == 1)

我尝试了下面的代码,但是这并没有区分一个接一个跟随的动作,而是将唯一id中所有出现的"for"相加.

aggregate(action_time ~ id + act, data=mean.event, FUN=sum)

Run Code Online (Sandbox Code Playgroud)

谢谢你的时间.

conditional r sum

mar*_*llt

lucky-day

5
推荐指数

1
解决办法

775
查看次数

多项logit模型和嵌套logit模型

我在程序R中使用mlogit包.我已将我的数据从其原始宽格式转换为长格式.这是转换后的data.frame的示例,我将其称为"long_perp".所有自变量都是个体特定的.我在数据集中有4258个独特的观察结果.

         date_id  act2 grp.bin pdist   ship   sea avgknots   shore day location chid  alt
4.dive 40707_004  TRUE       2 2.250 second light 14.06809 2.30805  12    Lower    4 dive
4.fly  40707_004 FALSE       2 2.250 second light 14.06809 2.30805  12    Lower    4  fly
4.none 40707_004 FALSE       2 2.250 second light 14.06809 2.30805  12    Lower    4 none
5.dive 40707_006 FALSE       2 0.000 second light 15.12650 2.53312  12    Lower    5 dive
5.fly  40707_006  TRUE       2 0.000 second light 15.12650 2.53312  12    Lower    5  fly
5.none 40707_006 …

Run Code Online (Sandbox Code Playgroud)

r multinomial logistic-regression mlogit

mar*_*llt

lucky-day

5
推荐指数

1
解决办法

1744
查看次数

在 R 中绘制距离和方位

我收集了有关船舶海鸟干扰的数据。我在船上带着测距双筒望远镜和角度板。对于我调查的每只鸟，我都有一个相对于船舶航向的起始距离和方位。我还有鸟做出反应（或在某些情况下没有反应）的距离和方位。

我想制作一个两面板图，其中一个显示起始距离和轴承位置，另一个显示终止距离和轴承。理想情况下，第二个图将进行颜色编码（或 pch 编码）以显示不同的反应类型。

我的数据是这种格式

      date_id dist bear act
550 40711_027  200   30   f
551 40711_028  500   45   n
552 40711_028  450   60   n
553 40711_028  400   75   n
554 40711_028  371   80   f
555 40711_029  200    5   f
556 40711_030  200   10   d
557 40711_031  400   30   n
558 40711_031  350   30   d

Run Code Online (Sandbox Code Playgroud)

这是您可以使用的格式的数据

id <- c(1,2,2,2,2,3,4,5,5)
dist <- c(200,500,450,400,371,200,200,400,350)
bear <- c(30,45,60,75,80,5,10,30,30)
act <- c("f","n","n","n","f","f","d","n","d")

dat <- data.frame(id, dist, bear, act)

Run Code Online (Sandbox Code Playgroud)

正如您所看到的，有些 id 是重复的，有些则只有一行。我想在一个地块上绘制第一个距离和熊，在另一个地块上绘制最后一个距离和熊（每个 ID）。对于只有一次观察的鸟类来说，这些可能是相同的。最好根据“act”列对第二个图中的点进行颜色编码。此外，方位没有左侧或右侧的指定，所以我可以接受所有点都位于中线的一侧或另一侧，但如果您知道将它们随机放置在中心线的左侧或右侧会很酷。理想情况下，绘图看起来像这样。

远方熊图

更新：遵循@jbaums 的建议，使用他在此处 …

plot r

mar*_*llt

2017 05-23

5
推荐指数

1
解决办法

2682
查看次数

从R？中的zeroinfl对象预测不到零吗？

我创建了一个零膨胀负二项式模型，想研究将多少个零分配给采样或结构零。我如何在R中实现这一点。zeroinfl页面上的示例代码对我来说还不清楚。

data("bioChemists", package = "pscl")

fm_zinb2 <- zeroinfl(art ~ . | ., data = bioChemists, dist = "negbin")

table(round(predict(fm_zinb2, type="zero"))) 
>   0   1 
> 891  24 

table(round(bioChemists$art))
    >   0   1   2   3   4   5   6   7   8   9  10  11  12  16  19 
    > 275 246 178  84  67  27  17  12   1   2   1   1   2   1   1

Run Code Online (Sandbox Code Playgroud)

这告诉我什么？

当我对数据执行相同操作时，我得到的读数只是样本量在1下列出？谢谢

r logistic-regression

mar*_*llt

lucky-day

4
推荐指数

1
解决办法

832
查看次数