我正在尝试使用 tbl_summary ()\n \ trial[c("trt", "age", "stage", "grade")] %>%
n 中的函数 sort = list (stage ~ "alphanumeric ") 更改 \xd1\x81characteristic 表列中的行顺序tbl_summary(by = trt, sort = list (grade ~ "alphanumeric"))
。这不起作用。\n我想看看(例如:T3、T 4、T1、T2 和 III 级 -> I 阶段)
我无法弄清楚如何告诉 tbl_summary 函数在汇总分类变量时显示小数位。它适用于像“mpg”这样的连续变量,但不适用于“cyl”。
library(tidyverse)
library(gtsummary)
# with decimal places
mtcars %>%
select(mpg) %>%
tbl_summary(digits = list(everything() ~ c(2)))
# no decimal places
mtcars %>%
select(cyl) %>%
tbl_summary(digits = list(everything() ~ c(2)))
Run Code Online (Sandbox Code Playgroud)
谢谢!
里奇
将我漂亮的表格提交给出版商后,他们希望将其保存为 Word 或 Excel 文件。有没有一种简单的方法可以将 gt 表保存为任一格式,或者我最好在 Excel 中重做它们?
我正在使用 mtcars 数据库,并且使用 tbl_summary 函数。我想做的是有两个分组依据,首先是变速箱类型,然后是气缸数量,所以我总共有六列分组依据加上整个列,到目前为止我只有能够仅使用一个变量进行分组。
这是我的代码:
mtcars2 <- within(mtcars, {
vs <- factor(vs, labels = c("V", "S"))
am <- factor(am, labels = c("Automatic", "Manual"))
cyl <- ordered(cyl)
gear <- ordered(gear)
carb <- ordered(carb)
})
mtcars2 %>%
tbl_summary(
by = cyl,
type = all_continuous() ~ "continuous2",
statistic = list(all_continuous() ~ c("{mean} ({sd})",
"{min}, {max}",
"{skew}"),
all_categorical() ~ "{n} / {N} ({p}%)"),
digits = all_continuous() ~ 1,
label = list(mpg ~ "Miles/ Gallon", disp ~ "Displacement (cu.in.)", hp ~ "Gross Horsepower", drat …
Run Code Online (Sandbox Code Playgroud) 使用 gtsummary R 包创建表时tbl_summary()
,默认设置将为大数字打印逗号。是否可以删除这些逗号?
例如,假设我想计算以下大尺度变量的中位数和 IQR:
set.seed(123)
data=data.frame(X=rnorm(100,mean=50000,sd=10000))
tbl_summary(data)
Run Code Online (Sandbox Code Playgroud)
我想在不使用逗号的情况下打印大量数字,但仍然使用逗号来分隔括号内的第一和第三分位数统计数据。因此输出应如下所示:50618 (45061, 56918)。这可能吗?
谢谢
我正在尝试对一些行/变量(分类变量和连续变量)进行分组,以帮助提高大型数据集中的表可读性。
这是虚拟数据集:
library(gtsummary)
library(tidyverse)
library(gt)
set.seed(11012021)
# Create Dataset
PIR <-
tibble(
siteidn = sample(c("1324", "1329", "1333", "1334"), 5000, replace = TRUE, prob = c(0.2, 0.45, 0.15, 0.2)) %>% factor(),
countryname = sample(c("NZ", "Australia"), 5000, replace = TRUE, prob = c(0.3, 0.7)) %>% factor(),
hospt = sample(c("Metropolitan", "Rural"), 5000, replace = TRUE, prob = c(0.65, 0.35)) %>% factor(),
age = rnorm(5000, mean = 60, sd = 20),
apache2 = rnorm(5000, mean = 18.5, sd=10),
apache3 = rnorm(5000, mean = 55, …
Run Code Online (Sandbox Code Playgroud) 我遇到了与该用户报告的类似问题。数值变量和连续变量被视为分类变量。让我们也使用汽车数据集,这样我们就有了可重现的东西可以使用。可以说我只是这样做:
tbl_summary(mtcars)
Run Code Online (Sandbox Code Playgroud)
大多数变量将被视为连续变量,但例如气缸、齿轮和碳水化合物将被视为分类变量。我理解(根据另一个问题)如何将所有变量视为连续变量,但是如果我喜欢我的大部分表格并且只想更改齿轮以将其视为连续变量怎么办?那可能吗?
在我的真实数据集中,我希望被视为连续的变量已经是一个数值变量,我真的不明白为什么它被视为分类变量,所以我想指定 gtsummary 应该将该特定变量视为连续变量。
我想在使用 R 包 gtsummary 中的 tbl_regression 生成的回归汇总表的变量名中引入下标。任何人都可以提供有关如何执行此操作的指导吗?用于生成表格的代码和结果表格如下所示。我希望标签“NO2”显示为“NO 2 ”。
library(tidyverse)
library(gtsummary)
case <- c(0,1,0,0,0,0)
no2 <- c(17, 14, 8, 9, 9, 7)
df <- data.frame(case, no2)
mod_adj <- glm(case~no2,data=df, family="binomial")
regression_table_adj <- mod_adj %>%
tbl_regression(exponentiate = TRUE, label = list(no2~"NO2"))
regression_table_adj
Run Code Online (Sandbox Code Playgroud)
由reprex 包(v0.3.0)于 2020-03-04 创建
我有一个连续变量,其中有很大比例的未知数。我的顾问要求我将百分比放在该栏中的旁边。这个 reprex 模仿了我想做的事情。
library(tidyverse)
library(gtsummary)
trial %>% # included with gtsummary package
select(trt, age, grade) %>%
tbl_summary()
Run Code Online (Sandbox Code Playgroud)
我试图将未知数的百分比列在未知数旁边,最好放在括号中。看起来像 11 (5.5%)。
有些人回复了关于丢失的数据如何出现在我的数据集中的请求,这是一个表示
library(gtsummary)
library(tidyverse)
#> Warning: package 'tibble' was built under R version 4.0.3
#> Warning: package 'readr' was built under R version 4.0.3
library(gtsummary)
df<-
tibble::tribble(
~age, ~sex, ~race, ~weight,
70, "male", "white", 50,
57, "female", "african-american", 87,
64, "male", "white", NA,
46, "male", "white", 49,
87, "male", "hispanic", 51
)
df %>%
select(age,sex,race,weight) %>%
tbl_summary(type = list(age ~ "continuous", …
Run Code Online (Sandbox Code Playgroud) 我会将 N 和 % 的值拆分为两个单独的列,即 N 和 % 列
library(gtsummary)
trial %>%
select(response, grade) %>%
tbl_summary()
Run Code Online (Sandbox Code Playgroud)