我正在尝试对一些行/变量(分类变量和连续变量)进行分组,以帮助提高大型数据集中的表可读性。
这是虚拟数据集:
library(gtsummary)
library(tidyverse)
library(gt)
set.seed(11012021)
# Create Dataset
PIR <-
tibble(
siteidn = sample(c("1324", "1329", "1333", "1334"), 5000, replace = TRUE, prob = c(0.2, 0.45, 0.15, 0.2)) %>% factor(),
countryname = sample(c("NZ", "Australia"), 5000, replace = TRUE, prob = c(0.3, 0.7)) %>% factor(),
hospt = sample(c("Metropolitan", "Rural"), 5000, replace = TRUE, prob = c(0.65, 0.35)) %>% factor(),
age = rnorm(5000, mean = 60, sd = 20),
apache2 = rnorm(5000, mean = 18.5, sd=10),
apache3 = rnorm(5000, mean = 55, …Run Code Online (Sandbox Code Playgroud) 我正在与 gtsummary 一起开发一个项目。对于其中一个表,我必须构建一个长表,列出 matchit 过程之前和之后的协变量。
我的问题是,对于所有协变量(例如Obesity ),它读取一行Obesity,然后读取下一行Obese,然后读取下一行Not Obese。这是三个表格,我只想显示其中一个:糖尿病 N (%)。
我尝试过编辑二分变量,引入Null,试图找到一个row_hide函数,但无济于事。
这是我的代码:
trialCAS1 <- index_CAS %>%
select(TopDecile, Gender, Obesity, Diabetes, Diabetes_Complex, etc)
Run Code Online (Sandbox Code Playgroud)
CAStable1 <- tbl_summary(trialCAS1,
by = TopDecile,
missing = "no") %>%
add_n() %>%
modify_header(label = "**Variable**") %>%
bold_labels()
Run Code Online (Sandbox Code Playgroud)
我包括了我得到的第一张桌子。
