小编use*_*411的帖子

在Rmarkdown knitr输出中指定ggplot图的高度和宽度

我用ggplot2创建了一个图,其中x轴标签不可读,除非图大于默认值.在Rstudio中查看时,我可以动态调整大小.使用ggsave()保存时,我可以指定高度和宽度.我如何在Rmarkdown文件中执行此操作,以便输出包含所需大小的图?

r ggplot2 knitr

18
推荐指数
3
解决办法
3万
查看次数

Rstudio:改变项目的git版本控制的起源

我最初在Rstudio中设置了git,同时参加了Coursera 的Data Scientist工具箱课程.不幸的是,我在我的博士项目中做到了这一点.存储库不再存在于github上.我现在正尝试使用knitr和bookdown在rmarkdown中撰写我的论文.我想使用版本控制,既可以学习正确的git工作流程,也可以对我在论文中所做的一切进行有条理的备份.但是,我无法更改Rstudio中的版本控制存储库.

  • 我无法在工具>版本控制>项目设置> Git/SVN菜单中更改此设置.Origin:文本框是不可更改的.
  • 我尝试使用旧的phd项目的工作目录创建一个新项目.这也克隆了版本控制设置.

如何更改原点以完成上述操作?

github rstudio bookdown

5
推荐指数
1
解决办法
4653
查看次数

如何在中断的分段时间序列回归中向ggplot添加线性段

我已经安装了一个中断的时间序列回归来计算数据,并希望显示与此类似的结果

时间序列

取自:Lindstrand A,Bennet R,Galanis I,et al.引入肺炎球菌结合疫苗后鼻窦炎和肺炎住院治疗.儿科.2014; 134(6):e1528-36.DOI:10.1542/peds.2013-4177.

具体来说,我正在尝试(和失败)再现的是分别添加品红色和青色趋势线.我一直试图在ggplot中这样做.问题是我的模型是合适的,glm(family = poisson)因此系数不是原始尺度.更复杂的是,我提供了风险人口作为偏移,glm(count ~ ., offset(log(at_risk)), family = poisson, data = df)但是想要(count / at_risk)*1000在Y轴上显示数据.

set.seed(42)
int = 85
df <- data.frame(
    count = as.integer(rpois(132, 9) + rnorm(132, 1, 1)),
    time = 1:132,
    at_risk = rep(
        c(4305, 4251, 4478, 4535, 4758, 4843, 4893, 4673, 4522, 4454, 4351),
        each  = 12
    )
)
df$month <- factor(month.name, levels = month.name)
df$intv <- ifelse(df$time >= int, 1, 0)
df$intv_trend <- c(rep(0, …
Run Code Online (Sandbox Code Playgroud)

r ggplot2

4
推荐指数
1
解决办法
879
查看次数

使用filter()和str_detect()按多个模式过滤

我想使用filter()和str_detect()匹配多个模式来过滤数据帧,而不需要多个str_detect()函数调用.在下面的示例中,我想过滤数据框df以仅显示包含字母a f和的行o.

df <- data.frame(numbers = 1:52, letters = letters)
df %>%
    filter(
        str_detect(.$letters, "a")|
        str_detect(.$letters, "f")| 
        str_detect(.$letters, "o")
    )
#  numbers letters
#1       1       a
#2       6       f
#3      15       o
#4      27       a
#5      32       f
#6      41       o
Run Code Online (Sandbox Code Playgroud)

我尝试了以下方法

df %>%
    filter(
        str_detect(.$letters, c("a", "f", "o"))
     )
#  numbers letters
#1       1       a
#2      15       o
#3      32       f
Run Code Online (Sandbox Code Playgroud)

并收到以下错误

警告消息:在stri_detect_regex中(字符串,模式,opts_regex = opts(模式)):较长的对象长度不是较短对象长度的倍数

r stringr stringi tidyverse

4
推荐指数
1
解决办法
7606
查看次数

survfit() 为区间删失数据生成令人难以置信的宽置信区间

我有一些数据是通过间歇性访谈产生的,其中询问一个人是否正在经历某种症状。上次已知每个人没有出现这种特定症状的时间表示为tstart。如果适用,观察到个体出现症状的时间为tstop。使用survivalR 中的包,使用该函数创建生存对象Surv,指定这是区间删失数据。我想要生存函数的非参数最大似然估计。这可以使用该函数来完成survfit,该函数似乎将调用传递给内部函数survfitTurnbull。由此产生的置信区间宽得令人难以置信。我无法弄清楚为什么会出现这种情况。

# A random sample of the data using dput()
structure(list(tstart = c(0.01, 38, 0.01, 0.01, 23, 26, 0.01, 
19, 0.01, 0.01, 22, 6, 0.01, 14, 16, 0.01, 0.01, 0.01, 0.01, 
21, 15, 0.01, 0.01, 13, 10, 0.01, 0.01, 19, 0.01, 0.01, 0.01, 
0.01, 22, 17, 27, 14, 16, 0.01, 20, 27, 10, 0.01, 0.01, 16, 20, 
7, 6, 15, 0.01, 0.01), tstop = c(4.01, …
Run Code Online (Sandbox Code Playgroud)

r survival-analysis survival

1
推荐指数
1
解决办法
364
查看次数